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Beschreibung 

Viterbi -Decoder 

5 

Die Erfindung betrifft einen Decoder zur Decodierung von Fal- 
tungscodes, gemaS dem Oberbegriff des Patentanspruchs 1. In 
der nachstehenden Beschreibung wird zum Stand der Technik Be- 
10 zug genommen auf folgende Quellen aus der Fachliteratur : 

G.D. Forney, jr. "The Viterbi Algorithm"; Proc . IEEE, 
Vol.61, No. 3, March 1973, pp. 268-278. 

P. Black et al . "A 140-Mb/s, 32-State, Radix-4 Viterbi 
Decoder"; IEEE Journal OF Solid-State Circuits, Vol.27, 
No. 12, December 1992, pp. 1877-1885. 

G. Fettweis et al . "A 100 Mbit/s Viterbi Decoder Chip: 
Novel Architecture and its Realization"; Proc. IEEE ICC, 
Vol.2, Atlanta August 1990, pp. 1877-1885. 
A. Yeung et al . "A 210Mb/s Radix-4 Bit-level Pipelined 
Viterbi Decoder", 1995 IEEE International Solid-State 
Circuits Conference, pp. 88-89. 

V.S. Gierenz et al . "A 550 Mb/s Radix-4 Bit-Level 
Pipelined 16-State 0.25-Mm CMOS Viterbi Decoder"; Proc. 
IEEE Inter. Conf. on Application-Specific Systems, 
Architectures, and Processors; Boston, July 2001, pp. 
195-201. 

R. Krambeck et al . "High-Speed Compact Circuits with 
CMOS"; IEEE Journal OF Solid-State Circuits, Vol.SC-17, 
No. 3, June 1982, pp. 614-619. 

Zur Ubertragung einer Sequenz digitaler Daten von einer Nach- 
richtenquelle tiber einen gestorten Kanal an eine Nachrichten- 
senke werden in zunehmendem Ma£e sogenannte Faltungscodes 
35 verwendet . Ein Faltungscodierer verknupft jedes Element oder 
"Wort" der Originalsequenz der Quelle gemaS einer gewahlten 
Funktion mit einer bestimmten Anzahl der jeweils direkt vor- 
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angegangenen Worter, urn eine Sequenz von Sendewortern auszu- 
geben, die eine groSere Bitbreite als die Worter der Origi- 
nalsequenz haben. Aufgrund dieser Redundanz in den Sendewor- 
tern ist es moglich, in den empf angenen Wortern auf der 
5 Empf angsseite eventuelle Verf alschungen der Sendeworter zu 
erkennen und auch zu korrigieren. 

Bei Kenntnis der gewahlten Verkmipfungsfunktion, die den Code 
eindeutig definiert, lasst sich namlich feststellen, inwie- 
weit eine Gruppe mehrerer aufeinander folgender Empf angswor- 
ter in das Schema des Codes "passt". Hierzu muss ein Fal- 
tungsdecoder die Wortgruppe mit alien denjenigen "erlaubten" 
Wortgruppen vergleichen, die theoretisch (bei alien moglichen 
Originalsequenzen) hatten empfangen werden konnen, wenn der 
Codierer einwandfrei arbeiten wurde und die Ubertragung sto- 
rungsfrei ware. Aus diesen Vergleichen werden sogenannte 
"Metriken" ermittelt, die angeben, wie nahe Oder wie fern die 
Empf angswortgruppe zu den einzelnen erlaubten Wortgruppen 
liegt, also wie wahrscheinlich oder unwahrscheinlich es ist, 
dass die Empf angswortgruppe aus der verglichenen erlaubten 
Wortgruppe hervorgegangen ist. In einer weiteren Vergleich- 
operation werden alle so ermittelten Metriken miteinander 
verglichen, und die erlaubte Wortgruppe, fur welche die 
ermittelte Metrik die maximale Wahrscheinlichkeit angibt, 
wird als gtiltige Wortgruppe ausgewahlt. 

Die Abstandsfunktion, die der Metrikberechnung zugrundeliegt , 
wird vorzugsweise den Eigenschaf ten des verwendeten Uber- 
tragungskanals und der verwendeten Modulationsf orm angepa&t. 
3 0 Dies geschieht unter wahrscheinlichkeitstheoretischen Uber- 
legungen. Die Abstandsfunktion kann so konzipiert sein, dass 
die Metrik umso kleiner ist, je naher sich die Vergleichs- 
objekte kommen. In diesem Fall wird die erlaubte Wortgruppe, 
fur welche die Metrik minimal ist, als gultige Wortgruppe 
3 5 ausgewahlt; es erfolgt also eine Decodierung durch Minimum- 
Auswahl. Die Abstandsfunktion kann aber auch so konzipiert 
sein, dass die Metrik umso groSer ist, je naher sich die 
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Vergleichsobjekte kommen. In diesem Fall wird die erlaubte 
Wortgruppe, fur welche die Metrik maximal ist, als gultige 
Wortgruppe ausgewahlt (Decodierung mit Maximum- Auswahl ) 

5 Von alien denkbaren Algorithmen zur Realisierung der vorste- 
hend beschriebenen Faltungsdecodierung hat sich mittlerweile 
in der Praxis der sogenannte Viterbi-Algorithmus durchge- 
setzt, dessen allgemeines Prinzip z.B. in [1] beschrieben 
ist. Die vorliegende Erfindung bezieht sich auf die schal- 

10 tungstechnische Ausbildung eines mit diesem Algorithmus 

arbeitenden Viterbi-Decoders. Zum besseren Verstandnis der 
Erfindung wird nachstehend zunachst das Grundprinzip von 

^ Viterbi-Decodern und deren Aufbau nach dem Stand der Technik 
anhand der Figuren 1 bis 10 erlautert . 

15 

Fig. 1 zeigt ein Diagramm der Abwicklung eines Radix-2- 

Trellis mit 4 Zustanden im Falle digitaler Ubertra- 
gung ; 

Fig. 2 zeigt ein Diagramm der Abwicklung eines Radix-2- 
20 Trellis mit 4 Zustanden im Falle analoger Ubertra- 

gung; 

Fig. 3 zeigt die wichtigsten Teilbausteine eines Viterbi- 
Decoders ; 

Fig. 4 zeigt die Transformation des Diagramms nach Fig. 1 
|25 in einen Radix-4-Trellis mit 4 Zustanden; 

Fig. 5 zeigt die Transformation des Diagramms nach Fig. 2 

in einen Radix-4-Trellis mit 4 Zustanden; 
Fig. 6 zeigt ein Beispiel fur einen Radix-4-Trellis mit 8 

Zustanden; 

3 0 Fig. 7 zeigt das allgemeine Schema eines Viterbi-Decoders 
mit einem Radix-4-Trellis , der 8 Zustande hat; 
Fig. 8 zeigt in Blockdarstellung den allgemeinen Aufbau und 
die gegenseitige Verbindung von Prozessorelementen 
in einem mit Bit-Pipelining arbeitenden Radix-4- 
3 5 Viterbi -Decoder nach dem Stand der Technik; 

Fig. 9 zeigt etwas ausfiihrlicher den Aufbau eines der 
Prozessorelemente nach Fig. 8; 
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Fig. 10 zeigt den kritischen Pfad zwischen Prozessorelemen- 
ten, wie sie in Fig. 8 dargestellt sind. 

Die Basis des Viterbi-Algorithmus bildet ein sogenannter 
5 "Trellis", der den verwendeten Faltungscode in Form eines 

Verzweigungsdiagramms eindeutig beschreibt . Die Fig. 1 zeigt 
einen Trellis fur einen Faltungscode, der aus einer Original- 
sequenz, deren Elemente jeweils nur 1 Bit umfassen, eine Sen- 
desequenz bildet, deren Elemente jeweils 2 Bits umfassen. Die 

10 vier moglichen Zustande (00, 01, 10, 11) der jeweils jungsten 
beiden Bits der Originalsequenz werden als "Trelliszustande " 
bezeichnet und sind langs der Ordinate an den Koordinaten A, 
^ B, C, D aufgetragen. Langs der Abszisse sind Zeitmarken tO, 
tl ... eines Taktes aufgetragen. Im Diagramm sind Knoten als 

15 Kreise gezeichnet, die eine Matrix aus Zeilen (in Richtung 
der Abszisse bzw. Zeitachse) und Spalten (in Richtung der 
Ordinate) bilden. Jeder Knoten steht fur einen Trelliszu- 
stand, der durch die Zeilenposition (Ordinate) des Knotens im 
Diagramm bestimmt ist. Von jedem der vier Knoten einer Spalte 

20 fuhren zwei Zweige, die als Pfeile dargestellt sind, zu zwei 
Knoten der nachstf olgenden Spalte. Daher der Name "Radix-2"- 
Trellis. 

Die Verkniipfungsvorschrif t des Codes ist in Fig. 1 durch 
lj^5 Dualzahlen (diinn geschrieben) an den Ursprungen und Enden der 
* Zweigpfeile angegeben. Die einstellige Dualzahl (0 oder 1) am 

Startpunkt eines Zweiges steht fur den Binarwert eines neuen 
Bits der Originalsequenz und wird im f olgenden als "Eingabe- 
zahl" bezeichnet. Die zweistellige Dualzahl am Ende des Zwei- 
30 ges gibt an, welcher neue Ausgabezustand (Binarwerte der 

beiden neuen Bits der Sendesequenz) sich infolge der neuen 
Eingabezahl der Originalsequenz ergibt; diese Zahl wird im 
f olgenden als " Ausgabezahl " bezeichnet. Ist z.B. der Trellis- 
zustand, also die jungsten beiden Bits der Originalsequenz, 
35 gleich 00 (ein A-Knoten) und wird ein neues Bit mit dem Bi- 
narwert 1 hinzugegeben, dann ergibt sich der neue Trellis- 
zustand 01 (Zweig mit der Eingabezahl 1 vom A-Knoten einer 



Infineon Technologies AG 



INF 1391 



Spalte zum B-Knoten der nachsten Spalte) , und die neue Ausga- 
bezahl wird 11, wie am Ende des betreffenden Zweiges einge- 
tragen. Hat das neue Bit der Originalsequenz hingegen den 
Wert 0, so dass auch der neue Trelliszustand gleich 00 ist 
5 (Zweig vom A-Knoten einer Spalte zum A-Knoten der nachsten 
Spalte), dann ergibt sich die Ausgabezahl 00. In ahnlicher 
Weise lassen sich anhand der Beschrif tungen in Fig. 1 auch 
die durch den Faltungscode bestimmten Beziehungen erkennen 
zwischen einerseits jedem der drei anderen moglichen Trellis- 
10 zustande und dem neuen Bit der Originalsequenz und anderer- 
seits der resultierenden neuen Ausgabezahl. 

Die Fiihrung der Zweige zwischen den Knoten zweier benachbar- 
ter Spalten und die an den Zweigen eingetragenen Eingabezah- 

15 len und Ausgabezahlen sind an jedem Spaltenpaar gleich und 

beschreiben den Faltungscode eindeutig und vollstandig. Daher 
genugt die Darstellung nur eines Spaltenpaares als Trellis 
zur Beschreibung des Codes. Die Fig. 1 zeigt jedoch mehr als 
zwei aufeinander folgende Spalten entlang der Zeitachse, also 

20 eine zeitliche Abwicklung des Trellis, urn die Entwicklung der 
2-Bit-Ausgabezahlen der Sendesequenz aus einer 1 Bit breiten 
Beispiels -Originalsequenz auf zuzeigen: 

Als Beispiel sei eine Originalsequenz mit der Bitfolge 0-1-1- 
( ^25 0 ... betrachtet, wie in der Tabelle iiber dem Diagramm darge- 
stellt. Als definierte Anf angssituation sei angenommen, dass 
der Trelliszustand vor dem ersten Bit der Originalsequenz 
gleich 00 ist (A-Knoten in der ersten Spalte) . Das erste Bit 
der betrachteten Originalsequenz ist 0, es fiihrt zum neuen 

30 Trelliszustand 00 (A-Knoten in der zweiten Spalte) und zur 
ersten Ausgabezahl 00 fur die Sendesequenz. Das zweite Bit 
der Originalsequenz ist 1, es fiihrt zum neuen Trelliszustand 
01 (B-Knoten in der dritten Spalte) und zur zweiten Ausgabe- 
zahl 11 fur die Sendesequenz. Das dritte Bit der Original- 

35 sequenz ist ebenfalls 1, es fiihrt zum neuen Trelliszustand 11 
(D-Knoten in der vierten Spalte) und zur dritten Ausgabezahl 
01 fur die Sendesequenz. Das vierte Bit der Originalsequenz 
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ist 0, es ftihrt zum neuen Trelliszustand 10 (C-Knoten in der 
fiinften Spalte) und zur vierten Ausgabezahl 01 fur die Sende- 
sequenz. Aus der Originalsequenz 0-1-1-0-.. . wird also die 
codierte Sendesequenz 00-11-01-01-... gebildet, wie es in der 
5 Tabelle uber dem Diagramm eingetragen ist. Die bei den be- 
schriebenen Codierungsschritten durchf ahrenen Zweige bilden 
zusammengenommen einen "Pfad", der quer durch das Trellis- 
diagramm geht und charakteristisch fur die Originalsequenz 
ist und der in Fig. 1 dick hervorgehoben ist. 

10 

Bei der Decodierung auf der Empf angsseite gilt es, diesen 
charakteristischen Pfad zu rekonstruieren, und zwar durch 
4& Analyse der empfangenen Version der Sendesequenz. Die 

Schritte des hierzu benutzten Viterbi-Algorithmus seien 
15 nachstehend an dem in Fig. 1 gezeigten Codierungsbeispiel 
beschrieben . 

Es sei vorerst angenommen , dass die Ausgabezahlen der Sende- 
sequenz digital als 2-Bit-W6rter ubertragen werden. Ein Uber- 

2 0 tragungsf ehler kann sich also nur darin auSern, dass einzelne 

Bits in der Empf angssequenz invertiert sind. Beim Erscheinen 
jedes Empf angssymbols, also mit jedem 2 -Bit-Wort der Emp- 
f angssequenz, wird die " Zweig" -Metrik aller (acht) Zweige 
zwischen benachbarten Spalten im Trellis nach Fig. 1 gegen- 
02 5 iiber diesem Empf angs symbol ermittelt. Basis hierfiir bilden 

die in Fig. 2 am Ende der Zweige eingetragenen Ausgabezahlen. 
Wenn, wie im angenommenen Fall, Ubertragungf ehler nur als 
Bit-Invertierung erscheinen konnen, kann es genugen, als 
Zweigmetrik die Anzahl der iibereinstimmenden Bits in den 

3 0 verglichenen Kandidaten zu ermitteln (entspricht 2 minus 

Hammingdistanz ) . Bei Ubereinstimmung aller Bits ist die 
Zweigmetrik gleich 2, bei Ubereinstimmung nur eines Bits ist 
die Zweigmetrik gleich 1, bei Nichtubereinstimmung aller Bits 
ist die Zweigmetrik gleich 0. 

35 

In der Fig. 1 sind die Zweigmetriken ZM als fett geschriebene 
Dezimalzahlen auf alien denjenigen Zweigen eingetragen, die 
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bei alien moglichen Empf angssequenzen durchlaufen werden 
konnten, wenn beim Trelliszustand 00 begonnen wird (A-Knoten 
in der ersten Spalte der Fig. 1), entsprechend der oben defi- 
nierten Anf angssituation. Somit scheiden die Zweige aller 
derjenigen Pfade, die ausschlieSlich den Knoten B, C und D 
der ersten Spalte entspringen, von vorn herein aus. Das 
heiSt, die betreffenden Zweige sind "unmoglich" , und ihre 
Zweigmetriken miissen unberucksichtigt bleiben; sie sind daher 
in der Fig. 1 mit "X" bezeichnet. 



Der erste Schritt auf der Empf angsseite, also die Verarbei- 
tung des ersten Empf angssymbols , beginnt am A-Knoten der 

" ersten Spalte. In der zweiten Spalte sind es nur die Knoten A 
und B, an denen es "mogliche" Eingangs zweige gibt, und zwar 

15 jeweils nur einer. Die Metriken dieser Zweige werden als 

"Pf admetriken" PM der betreffenden Knoten gespeichert, sie 
sind in der Fig. 1 als fette Dezimalzahlen innerhalb der die 
Knoten darstellenden Kreise eingetragen. 

20 Bei jedem der folgenden Schritte werden fur alle Knoten 
jeweils neu Pf admetriken ermittelt und gespeichert. Zur 
Ermittlung der jeweiligen neuen Pf admetriken, die innerhalb 
der die betreffenden Trellisknoten darstellenden Kreise ein- 
getragen sind, werden zwei algebraische Summen ermittelt: fur 
jeden der beiden Eingangs zweige am Knoten die Summe der 
Zweigmetrik dieses Zweiges mit der Pfadmetrik des Ursprungs- 
knotens dieses Zweiges. Die beiden Summen werden verglichen, 
und die groSere von beiden wird als akkumulierte neue Pfad- 
metrik des betreffenden Knotens gespeichert. Nur der Ein- 
3 0 gangszweig, der diese neu Pfadmetrik hervorbrachte, bleibt 
als "Survivor" (Uberlebender ) des betreffenden Knotens fur 
die Rekonstruktion des charakteristischen Pfades interessant. 

Sofern an einem Knoten ein "unmoglicher " Eingangszweig mun- 
35 det, muss dieser Zweig natiirlich ohne Einfluss auf die Pfad- 
metrik-Berechnung bleiben. Dies kann man z.B. erreichen, 
indem man einfach die Pfadmetriken vor dem ersten Schritt 
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(also an den Knoten der ersten Spalte) so einstellt, dass die 
Pfadmetrik am Startknoten A der ersten Spalte urn mindestens 
das MaS der maximal moglichen Zweigmetrik (also um mindestens 
die Zahl 2 im Falle der Fig. 1) groSer ist als an den anderen 
5 Knoten der ersten Spalte. Wahlt man z.B. fur den Startknoten 
A der ersten Spalte die Pfadmetrik 0, wie in Fig. 1 darge- 
stellt, dann sind die Pfadmetriken der anderen Knoten dieser 
Spalte auf die negative Zahl -(^2) einzustellen . Alternativ 
kann man natlirlich auch die Pfadmetrik des Startknotens auf 
10 >2 und die Pfadmetriken der anderen Knoten auf 0 einstellen. 

Anhand der Eintragungen in den Trellisknoten der Fig. 1 er- 
' kennt man, dass sich der charakteristische Pfad vom Ende her 

rekonstruieren lasst, indem man jeweils von demjenigen Knoten 
15 einer Spalte, dessen Pfadmetrik am groSten ist, zu demjenigen 
Knoten der vorangehenden Spalte zuruckschreitet , der dort die 
maximale Pfadmetrik hat. Somit gibt die Sequenz der Eingabe- 
zahlen der Zweige dieses Pfades die Originalsequenz wieder. 

20 Wegen der Redundanz der Codierung ist der charakteristische 
Pfad resistent gegenuber einem gewissen MaS an Ubertragungs- 
fehlern. Es sei z.B. angenommen, dass beim Empfang das erste 
Bit 0 des dritten Sendesymbol falschlich als 1 angekommen ist 
(oder falschlich als 1 bewertet wurde) , wie in Klammern () in 

£5 Fig. 1 gezeigt . Beim Decodierschritt 3 ergeben sich dann die 
in Klammern angegebenen Zweigmetriken, was zu den in Klammern 
angegebenen Anderungen der Pfadmetriken f iihrt . Wie ersicht- 
lich, fuhrt die Rekonstruktion des charakteristischen Pfades 
jedoch zum gleichen Ergebnis wie bei fehlerfreier Ubertra- 

30 gung. Die Originalsequenz wird also trotz des besagten Uber- 
tragungsf ehlers korrekt wieder gewonnen . 

In vielen Fallen wird die Sendesequenz nicht digital sondern 
in Form von Analogwerten ubertragen. Das bedeutet fur die in 
35 Fig. 1 gezeigte Originalsequenz 0-1-1-0, dass die am Fal- 

tungscodierer ausgegebenen Digitalworter 00-11-01-01 in die 
entsprechenden Analogwerte 0-3-1-1 umgewandelt werden, um 
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z.B. eine Sendespannung innerhalb eines Bereichs zwischen 0 
und 3 Volt zu modulieren, wie in Fig. 2 gezeigt . Auf der Emp- 
fangsseite wird diese Spannung in synchronisierter Weise 
abgetastet. Wegen unvermeidlicher Verzerrungen und anderer 
5 Storungen im Ubertragungskanal werden die Abtastwerte nicht 
hochgenau den Werten der Sendesequenz entsprechen, sondern 
mehr oder weniger davon abweichen. In der Fig. 2 ist der Fall 
gezeigt, dass aus der Sendesequenz 0-3-1-1 die empf angsseiti- 
gen Abtastwerte 0 , 2--2 , 7--1 , 6--1 , 1 gewonnen werden. 

10 

Die Decodierung nach dem Viterbi-Algorithmus verlauft in 
diesem Fall sehr ahnlich wie im Falle der Fig. 1, nur dass 

^ die Pfadmetriken nicht aus dem Zweierkomplement der Hamming- 
distanz ermittelt werden, sondern arithmetisch . So konnen die 

15 Pfadmetriken z.B. bestimmt werden durch Ermittlung des Betra- 
ges der Differenz zwischen Ausgabezahl, die in Fig. 2 als 
Dezimalzahl geschrieben ist, und Empf angs-Abtastwert und Sub- 
traktion dieses Betrages von irgendeinem festen Wert, der 
gleich oder grofier ist als der hochstmogliche Abtastwert. In 

20 der Fig. 2 sind die so ermittelten Zweigmetriken ZM und auch 
die jeweils resultierenden maximalen Pfadmetriken PM fur den 
Fall eingetragen, dass der besagte feste Wert gleich 3 ist. 
Es zeigt sich, dass der beim Decodieren vom Ende her zuriick- 
verfolgte Pfad iiber die jeweils groSten Pfadmetriken (dick 

^5 gezeichneter Linienzug) genau dem charakteristischen Pfad 

entspricht, mit dem die Originalsequenz exakt wiedergewonnen 
wird, trotz der von der Sendesequenz abweichenden Abtastwerte 
der Empf angssequenz . 

30 Aus der vorstehenden Grundlagenbeschreibung ergibt sich, dass 
ein Viterbi -Decoder insgesamt die in der Fig. 3 als Blocke 
gezeichneten Teilbausteine benotigt: erstens eine Zweigme- 
trik-Berechnungseinrichtung, gewohnlich abgekurzt bezeichnet 
als BMU (Branch Metric Unit) , welche die Eingangssequenz 

35 (Empf angssequenz ) empfangt und mit dem Trellis des verwende- 
ten Faltungscodes programmiert ist, urn die Zweigmetriken im 
Trellis abhangig von der Eingangssequenz zu berechnen; zwei- 
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tens eine Addier-Vergleichs-Auswahl-Einrichtung, gewohnlich 
abgekurzt bezeichnet als ACSU (Add-Compare-Select Unit) , zur 
Berechnung der Pfadmetriken durch die oben beschriebenen 
Additions- und Vergleichsvorgange und zum Treffen der Ent- 
5 scheidung beziiglich der Auswahl der jeweils maxiitialen Pfad- 
metrik fur die Trellisknoten; drittens einen Pf adspeicher , 
gewohnlich abgekurzt bezeichnet als SMU (Survivor Memory 
Unit) , zur Speicherung der in der ACSU getrof fenen Entschei- 
dungen, welche die jeweiligen Survivoren bezeichnen, aus 
10 denen sich dann der charakteristische Pfad rekonstruieren 
lasst, urn die Originalsequenz wiederzugewinnen . 

^ In der BMU konnen die Zweigmetriken fur alle Zustande A, B, C 

und D des Trellis, also an alien Knoten langs einer Spalte, 
15 parallel berechnet werden. In der ACSU wird jede neue Pfad- 
metrik ermittelt durch Auswahl der jeweils hochsten Summe von 
vorhergehender Pfadmetrik und neuen Zweigmetriken, wie es 
oben anhand der Fig. 1 beschrieben wurde. Somit braucht die 
ACSU eine Rlickkopplungsschleif e mit Speicherregister fur die 
20 vorhergehende Pfadmetrik, wie in Fig. 3 gezeigt. Aufgrund 

dieser Rlickkopplungsschleif e ist die ACSU besonders kritisch 
fur das Zeitverhalten des Decoders, was den Durchsatz 
begrenzt. Ein den Durchsatz steigerndes "Pipelining" (also 
eine Fliefibandverarbeitung unter Einfugung von Pipeline- 
registern fur Zwischenwerte) bei der Addition-Vergleich- 
Auswahl-Operation fur die einzelnen Pfade ist in der ACSU 
nicht moglich wegen der Datenabhangigkeit aufeinander folgen- 
der Berechnungsschritte . Die Pfadmetriken fur ein Eingangs- 
symbol konnen namlich erst berechnet werden, wenn die Pfad- 
30 metriken fur das vorherige Eingangs symbol vorliegen. Eine 

weitere wichtige Randbedingung bei der Losung des Durchsatz- 
problems stellt das eingeschrankte Energiebudget (Forderung 
nach moglichst wenig Energiebedarf z.B. wegen einfacher Pla- 
sikgehause) und die Forderung nach moglichst kostengtinstiger 
35 Implementierung in einem Standard-CMOS-Prozess dar. Deswegen 
kommt die zwar schnelle aber teure und stromf ressende Bipo- 
lar- bzw. ECL-Technologie meist nicht in Betracht. Aus der 
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Literatur sind aber verschiedene architekturale Ansatze be- 
kannt, den Durchsatz des Decoders zu steigern. 

Ein erster Ansatz zur Durchsatzsteigerung besteht darin, 
statt eines Radix-2-Trellis , wie er in Fig. 1 dargestellt ist 
(jeweils zwei Zweige am Eingang und Ausgang der Trelliskno- 
ten) , einen Radix-4-Trellis zu benutzen, der jeweils vier 
Zweige am Eingang und Ausgang der Trellisknoten hat, wie es 
z.B. in [2] beschrieben ist. Die Fig. 4 zeigt die zeitliche 
Abwicklung eines Radix-4-Trellis , geltend fur den gleichen 
Faltungscode und die gleichen Original- und Sendesequenzen 
wie in Fig. 1. Ein Vergleich der Figuren 1 und 4 zeigt, dass 
im Radix-4-Trellis jeweils zwei aufeinander folgende kleine 
Schritte des Radix-2-Trellis zu einem einzigen groSen Schritt 
zusammengef asst sind. In Fig. 4 entsprechen die Knoten, wel- 
che fur Beginn und Ende des groSen Schrittes 1 gelten, denje- 
nigen Knoten der Fig. 1, die dort fur den Beginn des kleinen 
Schrittes 1 und das Ende des kleinen Schrittes 2 gelten. Die 
Knoten, die in Fig. 4 fur Beginn und Ende des groSen Schrit- 
tes 1 gelten, entsprechen denjenigen Knoten der Fig. 1, die 
dort fur den Beginn des kleinen Schrittes 3 und das Ende des 
kleinen Schrittes 4 gelten. 

Wegen der Zusammenf assung jeweils zweier Schritte ist gemaS 
Fig. 4 die Anzahl der Ausgangsverzweigungen und die Anzahl 
einmiindenden Zweige an jedem Knoten von 2 auf 4 verdoppelt. 
Dementsprechend haben auch die Eingabezahlen, die an den 
Anfangen der Zweige eingetragen sind und den Zweig kennzeich- 
nen, jeweils doppelt so viele Bits wie in Fig. 1, namlich 2 
Bits. Die Ausgabezahlen, die in Fig. 4 an den Enden der 
Zweige eingetragen und fur den Code charakteristisch sind, 
haben vier Bits. Bei jedem Decodierschritt werden vier auf- 
einander folgende Bits der Empf angssequenz mit den Ausgabe- 
zahlen aller Zweige verglichen, urn die jeweilige Zweigmetrik 
zu ermitteln. Die Zweig- und Pfadmetriken und der charakteri- 
stische Pfad fur die hier betrachtete Beispiels-Originalse- 
quenz sind auch in der Fig. 4 als fett geschriebene Dezimal- 
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zahlen bzw. dick hervorgehobener Linienzug dargestellt. Es 
zeigt sich auch hier, dass der beim Decodieren vom Ende her 
zuriickverf olgte Pfad iiber die jeweils groSten Pf adxnetriken 
(dick gezeichneter Linienzug) genau dem charakteristischen 
5 Pfad entspricht, mit dem die Originalsequenz wiedergewonnen 
wird. Es lasst sich leicht nachvollziehen, dass dies auch 
beim Auftreten von Ubertragungsf ehlern gelten wird, genau so 
wie im Falle der Fig. 1. 

10 In Fig. 5 ist der Radix-4-Trellis fur den Fall dargestellt, 
dass die Ubertragung durch Analogwerte erfolgt und die Emp- 
fangssequenz durch Abtastung des empfangenen Analogsignals 

^ erhalten wird, wie oben in Verbindung mit Fig. 2 beschrieben. 
Ahnlich wie bei dem Radix-4-Trellis nach Fig. 3 werden auch 

15 hier jeweils zwei aufeinander folgende Empf angssymbole in 
einem gemeinsam "groSen" Schritt verarbeitet. Bei jedem 
Schritt ergeben sich die Zweigmetriken aus der Summe des 
Betrages der Differenz zwischen dem jeweils ersten Empfangs- 
symbol eO und dem hoherwertigen Teil sO der Ausgabezahl und 

20 des Betrages der Differenz zwischen dem jeweils zweiten Emp- 
fangssymbol el und dem niedrigerwertigen Teil si der Ausgabe- 
zahl (die Werte sO und si sind in der Fig. 5 jeweils dezimal 
geschrieben) . Besagte Summe wird von einem festen Betrag 
abgezogen, der beim dargestellten Beispiel gleich 6 gewahlt 

^5 ist, also doppelt so hoch wie in Fig. 2. Es ergeben sich so- 
mit die gleichen Pfadmetriken wie in Fig. 2. 

Durch den Ubergang vom Radix-2-Trellis auf einen Radix-4- 
Trellis beim Decodieren steht die doppelte Zeit fur jeden 

30 Schritt zur Verfiigung. Im Radix-4-Trellis gibt es fur jeden 
Trelliszustand jedoch vier mogliche Vorgangerzustande, so 
dass der Vergleich der Pfadmetriken und die Auswahl der je- 
weils maximalen Pfadmetrik zum Herausfinden des wahrschein- 
lichsten Vorgangerzustandes und somit zur moglichst korrekten 

35 Rekonstruktion des charakteristischen Pfades komplizierter 
werden. Insgesamt resultiert jedoch ein Durchsatzgewinn . 
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Natlirlich sind Faltungscodes und dazu passende Viterbi- 
Decoder nicht beschrankt auf nur 4 Trelliszustande A bis D. 
Die Fig. 6 zeigt ein Beispiel fur einen Radix-4-Trellis mit 
acht Zustanden A bis H, wie er in [2] beschrieben ist. Ebenso 
5 sind Faltungscodes und Viterbi-Decoder mit noch mehr Trellis- 
zustanden moglich, z.B. mit 16 oder 32 Trelliszustanden. In 
jedem Fall werden jedoch, solange es sich urn einen "Radix-4" - 
Trellis handelt, fur jeden Trelliszustand 4 Zweigmetriken 
verarbeitet. In der Fig. 6 sind die vier Eingabezahlen an den 
10 Ursprungen der Zweige, die den Eingabezahlen in Fig. 4 oder 

Fig. 5 entsprechen, nicht eingetragen, urn die Zeichnung nicht 
zu verwirren. Aus dem gleichen Grund sind in Fig. 6 auch die 
den Code beschreibenden Ausgabezahlen an den Enden der Zweige 
weggelassen. 
15 

Der in Fig. 3 gezeigte allgemeine Aufbau eines Viterbi- 
Decoders ist in der Fig. 7 etwas ausf uhrlicher dargestellt 
fur den in Fig. 6 gezeigten Beispielsf all eines Radix-4- 
Trellis mit acht Trelliszustanden A, B, C, D, E, F, G, H. Die 

20 ACSU enthalt dementsprechend acht Abteilungen A bis H, um fur 
jeden Trelliszustand bei jedem Taktintervall t der Perioden- 
dauer T die maximale akkumulierte Pfadmetrik PMM(t) zu be- 
rechnen. Diese Berechnung erfolgt durch Addition jeder der 
vier Zweigmetriken ZM1 bis ZM4, die fur dieses Taktintervall 

^5 von der BMU geliefert werden, mit der dem betreffenden Zweig 
zugeordneten maximalen Pfadmetrik PMM des vorhergehenden 
Berechnungsvorganges , gegenseitigen Vergleich der vier Addi- 
tionsergebnisse und Auswahl des Maximums. In der Fig. 7 ist 
nur die Abteilung A (fur den Trelliszustand A) detaillierter 

30 dargestellt. In dieser Abteilung wird die Zweigmetrik ZMl mit 
der maximalen Pfadmetrik PMM aus der gleichen Abteilung ad- 
diert; ZM2 wird mit PMM aus der Abteilung C addiert; ZM3 wird 
mit PMM aus der Abteilung G addiert, und ZM4 wird mit PMM aus 
der Abteilung G addiert, wie es dem Trellisdiagramm nach Fig. 

35 6 entspricht. In den anderen Abteilungen B bis H ist die Zu- 
ordnung zwischen den Zweigmetriken ZMl : 4 und den jeweils zu 
addierenden Pfadmetriken PMM natiirlich anders als in der Ab- 
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teilung A, und zwar jeweils so, wie es das Trellisdiagramm 
vorschreibt . 

Da die Werte der akkumulierten Pf admetriken PM durch fortlau- 
5 fendes Hinzaddieren der Zweigmetriken ZM von Takt zu Takt 

immer groSer werden, ist der Wertebereich der Pf admetriken PM 
grofier als der Wertebereich der Zweigmetriken ZM. Demnach muS 
die Bitbreite "m" der Verarbeitungseinrichtungen in der ACSU 
an den Wertebereich der Pf admetriken PM angepafit sein. In der 
10 Fig. 7 ist die gleiche Zahl "m" fur die Bitbreite sowohl der 
Pf admetriken als auch der Zweigmetriken eingetragen. Das 
hei£t, ein in Dualzahldarstellung binarcodierter Zweigmetrik- 
Wert ist durch Einfiigung vorangestellter Nullbits auf die 
Bitbreite m gebracht . 

15 

In jeder der acht ACSU-Abteilungen A bis H wird der Wert des 
dort ermittelten Maximums im Register der betreffenden Abtei- 
lung gespeichert, als neue maximale Pfadmetrik PMM fur den 
nachsten Schritt. Die Information daruber, welche der vier 
20 Pf admetriken PM1 bis PM4 in einer Abteilung die jeweils maxi- 
male Pfadmetrik PMM ist, bezeichnet den Survivor fur den 
betreffenden Trelliszustand. Diese acht Survivor- Inf ormatio- 
nen werden in der SMU gespeichert . 

Ein besonderes Problem ergibt sich, wenn die in der ACSU ver- 
arbeiteten GrQSen vielstellige Zahlen sind. Auch bei analoger 
Ubertragung und Abtastung der Empf angssequenz erfolgt in der 
Praxis die weitere Verarbeitung der Abtastwerte, also deren 
Vergleich mit den codebeschreibenden Ausgabezahlen und die 
30 anschlieSenden Metrik-Berechnungen, nattirlich wieder mittels 
der Digitaltechnik. Deswegen miissen die Abtastwerte digitali- 
siert werden. Zur Erzielung hoher Genauigkeit ist eine hohe 
Auflosung der Digitalisierung erwunscht, was meist eine rela- 
tiv groSe Bitbreite und somit eine groSe Stellenzahl bzw. 
35 Wortlange der digitalisierten Zweigmetriken ZM und somit auch 
der akkumulierten Pf admetriken bedeutet. Bei der Addition 
mehrstelliger Dualzahlen in der ACSU erfordert die "Carry- 
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Propagierung" , also die Akkumulation und das Durchleiten der 
Carry-Bits (Ubertrag-Bits ) von der letzten Stelle LSB zur 
ersten Stelle MSB eigene Miniaturschritte . Dieses sogenannte 
"Ripple", verlangert den Additionsvorgang umso mehr, je 
5 groSer die Wortlange bzw. Bitbreite ist. 

Ein bekannter Ansatz zur Reduzierung des erwahnten Ripple- 
Effektes und somit zur weiteren Steigerung des Durchsatzes 
von Viterbi-Decodern ist das in [3] beschriebene "Bit-Pipeli- 
10 ning" mit "Carry-Save " -Darstel lung, also eine FlieSbandverar- 
beitung der Bits mit redundanten Darstellungen zur Einsparung 
des Ubertrages. Hierbei erfolgen die Addition und der Ver- 
gleich in der ACSU bitweise beginnend mit dem MSB, also be- 
ginnend dem Bit hochsten Stellenwertes , auf der Grundlage 
15 redundanter Zahlendarstellung der Pfadmetrik, wobei die Addi- 
tion ohne durchgehende Carry- Propagierung durchgefuhrt wird. 
Eine aus [4] bekannte Weiterentwicklung besteht darin, durch 
Umcodierung der redundanten Zahlendarstellung der Pfadmetri- 
ken die Maximum- Ident if izierung auf eine einfache ODER-Ver- 
20 kntipfung zu reduzieren. SchlieSlich kann man, wie aus [5] 
bekannt, den Vergleich auf Bit-Ebene parallel durchfuhren, 
wobei alle vier Pfadmetriken PMl bis PM4, die beim Radix-4- 
Trellis fur einen Trelliszustand ermittelt werden, parallel 
mit den drei anderen Pfadmetriken verglichen werden. Dieser 
p5 Vergleich .kann lokal fur jeden Zweig und somit sehr effizient 
und schnell erfolgen. Aufgrund der redundanten Zahlendarstel- 
lung wird die Entscheidung fur jeden Zweig mit 2 Bits co- 
diert: eines druckt eine "praliminare " (also vorlaufige) Ent- 
scheidung aus, und das andere druckt eine "finale" (also end- 
30 gtiltige) Entscheidung aus. 

Die Kombination aller vier beschriebenen Mafenahmen zur Durch- 
satzsteigerung, namlich 

i) Ubergang auf Radix-4-Trellis , 
35 ii) Pipelining mit redundanter Zahlendarstellung, 

iii) Maximum- Ident if izierung durch ODER-Funktion, 
iv) paralleler Vergleich auf Bit-Ebene, 
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stellt zur Zeit den Stand der Technik bei der CMOS- Imp lemen- 
tierung fur hochste Durchsatz-Anf orderungen bei gleichzeitig 
moderater Energieauf nahme dar. Die Fig. 8 veranschaulicht in 
einer Blockdarstellung, wie eine Abteilung der in Fig. 6 dar- 
5 gestellten ACSU gemaS diesem Stand der Technik ausgebildet 

ist, und zwar speziell am Beispiel der Abteilung A. Alle acht 
Abteilungen sind in gleicher Weise aufgebaut, sie unterschei- 
den^sich nur darin, mit welchen der acht maximalen Pfadmetri- 
ken PMM die in ihnen verarbeiteten vier Zweigmetriken ZM je- 
10 weils addiert werden. 

I GemSS der Fig. 8 ist fur jede der vier Zweigmetriken ZM1 bis 
VP • ZM4 eine Kaskade hintereinander geschalteter Prozessorele- 

mente PE vorgesehen. Jedes Prozessorelement PE innerhalb der 
15 Kaskade berechnet eines der m Pf admetrik-Bits aus dem 

zugeordneten Bit der betreffenden Zweigmetrik. Jede Kaskade 
enthalt also m Prozessorelemente, so dass die Anordnung fur 
jeden Trelliszustand insgesamt 4 mal m Prozessorelemente 
umfasst. Dargestellt sind nur zwei davon, deren eines einem 
20 beliebigen n-ten Bit mit dem Stellenwert 2 n innerhalb des m- 
Bit-Wortes zugeordnet ist, und deren anderes dem (n+l)-ten 
Bit (nachsthoherer Stellenwert 2 n+1 ) zugeordnet ist. Jedes 

Prozessorelement enthalt drei Funktionsblocke : einen Addi- 

* 

tionsblock ADD, einen Schreibweise-Modif ikationsblock MOD und 
?5 einen Vergleicherblock VGL. Alle vier Prozessorelemente, die 
jeweils dem selben Bit-Stellenwert zugeordnet sind, haben 
liber ein 8-adriges Verteilungs-Leitungsbtindel Verbindungen 
sowohl miteinander als auch mit 8 Eingangen eines Maximum- 
I dent if izierungsblocks MAX . 

30 

In den f olgenden Figuren -und auch in der nachstehenden Be- 
schreibung sii^d Prozessorelemente und die an der Verarbeitung 
beteiligten Bits durch Abkiirzungen in GroSbuchstaben mit 
einem nachgestellten Suffix bezeichnet. Im Suffix gibt eine 
35 arabische Ziffer 1, 2, 3 Oder 4 (oder allgemein: "i") die 

Zuordnung zur jeweiligen Zweigmetrik ZM1 , ZM2 , ZM3 oder ZM4 
(oder allgemein ZMi) an, und der Klammerausdruck gibt die 
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Zuordnung zum Bit-Stellenwert des betreffenden Zweigmetrik- 
Wortes an. Ein Doppelpunkt ":" zwischen zwei nachgestellten 
Suf f ix-Symbolen bedeutet "bis". 

5 Aufbau und Wirkungsweise der Funktionsblocke ADD, MOD und VGL 
sind in alien Prozessorelementen gleich. Die Fig. 9 zeigt 
detailliert, als stellvertretendes Beispiel fur alle Prozes- 
sorelemente, den Aufbau speziell des Prozessorelementes 
PE4(n), also des Prozessorelementes fur das n-te Bit der 
10 Zweigmetrik ZM4, zusammen mit dem Funktionsblock MAX (n) . 



I 



Im Betrieb arbeiten die Prozessorelemente einer Kaskade 
PE(MSB:LSB) zeitgestaf f el t urn einen Halbtakt T/2 versetzt von 
links nach rechts, also beginnend mit dem MSB (hochstwertiges 
15 Bit) und f ortschreitend bis zum LSB (niedrigstwertiges Bit) . 
In jedem Prozessorelement PE(n) empfangt der Block ADD das 
zugeordnete Bit n der Zweigmetrik ZMi und eine redundante 2- 
Bit-Darstellung PMMa:b(n) fur das Bit n der maximalen Pfad- 
metrik. Der Block ADD liefert ein Summenbit SUi(n), das im 
20 Halbtakt 3>A tiber eine Latch-Schaltung L3>A weitergegeben wird, 
und ein Carry-Bit CAi (n) , das zum vorangehenden Prozessorele- 
ment PE(n+l) der selben Reihe ruckgekoppelt wird. 

Der Block MOD hat einen Summenbit -Eingang zum Empfang des im 
||25 Halbtakt 3>A weitergegebenen Summenbits SU, einen Carry-Ein- 
gang, auf den das Carry- Bit vom Block ADD des nachf olgenden 
Prozessorelementes der selben Kaskade ruckgekoppelt wird, und 
auSerdem zwei Entscheidungsbit-Eingange zum Empfang eines 
praliminaren Entscheidungsbits EBP(n+l) und eines finalen 
30 Entscheidungsbits EBF(n+l), die vom Block VGL des vorangehen- 
den Prozessorelementes PE(n+l) erzeugt werden . Der Block MOD, 
der aus einem .System von UND-Gattern und ODER-Gattern be- 
steht, verkmipft diese vier empfangenen Bits, um vier Aus- 
gangsbits zu erzeugen: eine redundante praliminare 2-Bit- 
35 Darstellung PMPa:b fur das Bit n der Pfadmetrik und eine 

redundante finale 2-Bit-Darstellung PMFa:b fur das Bit n der 
Pfadmetrik. Hierbei gelten folgende Wahrheitstabellen : 
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Tabelle 1 



CA(n-l) 


x 


o 


o 


1 


1 


SU (n) 


x 


o 


1 


o 


1 


EBP (n+1 ) 


o 


1 


1 


1 


1 


PMPa (n) 


0 


0 


1 


1 


1 


PMPb(n) 


0 


0 


0 


0 


1 


Tabelle 


2 










CA(n-l) 


X 


0 


0 


1 


1 


SU(n) 


X 


0 


1 


0 


1 


EBF (n+1) 


0 


1 


1 


1 


1 


PMFa(n) 


0 


0 


1 


1 


1 


PMFb(n) 


0 


0 


0 


0 


1 



Hierbei steht x fur "beliebiger Wert", Die vier MOD-Ausgangs- 
^5 bits PMPa:b und PMFa:b werden uber die Latch-Schaltungen LOB 
im Halbtakt OB weitergegeben . Die Latch-Schaltungen LOA und 
LOB haben somit die Funktion von Pipeline-Registern. 

Im einzelnen werden die praliminaren Pf admetrik-Bits PMPa:b 
10 vom Block MOD im Halbtakt OB auf ein zugeordnetes Adernpaar 
des 8-adrigen Verteilungs-Leitungsbiindels gegeben. Dieses 
Verteilungsbiindel enthalt insgesamt vier verschiedene Adern- 
paare, deren jedes genau einem der vier Prozessorelemente 
PEl:4(n) zugeordnet ist. 

15 

Die finalen Pf admetrik-Bits PMFa:b werden im Halbtakt OB dem 
Vergleicherblock VGL angelegt. Im selben Halbtakt empfangt 
der VGL-Block das Ergebnis einer ODER-Verkniipf ung der prali- 
minaren Pf admetrik-Bits PMPa der drei anderen Prozessorele- 

2 0 menten PE und das Ergebnis einer ODER-Verkniipf ung der prali- 

minaren Pf admetrik-Bits PMPb der drei anderen Prozessorele- 
menten PE, wobei besagte Bits von den betreffenden Adernpaa- 
ren des Verteilungsbiindel s abgeleitet werden. Der Block VGL 
empfangt im Halbtakt OB ferner das praliminare En tschei dungs - 
25 bit EBP(n+l)~ des vorangehenden Prozessorelementes PE(n+l). 
Der VGL-Block enthalt ein System von Multiplexers urn das 
praliminare Entscheidungsbit EBP (n) und das finale Entschei- 
dungsbit EBF (n) zu erzeugen. 

3 0 Der Block MAX enthalt zwei ODER-Gatter, urn die beiden Bits 
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PMMa:b(n) fur die redundante 2-Bit-Darstellung des Bits n der 
maximalen Pfadmetrik zu erzeugen. Das eine ODER-Gatter emp- 
fangt alle vier praliminaren Pf admetrik-Bits PMPl:4a(n) aus 
den vier Prozessorelementen PEl:4(n) und stellt das Bit 
5 PMMa(n) genau dann auf den Wert Binarwert 1, wenn mindestens 
eines dieser vier empfangenen Bits gleich 1 ist. Das andere 
ODER-Gatter empfangt alle vier praliminaren Pf admetrik-Bits 
PMPl:4b(n) aus den vier Prozessorelementen PEl:4(n) und 
stellt das Bit PMMb(n) genau dann auf den Wert Binarwert 1, 
10 wenn mindestens eines dieser vier empfangenen Bits gleich 1 
ist . 



Das vorstehend anhand der Figuren 8 und 9 beschriebene ACSU- 
System nach dem Stand der Technik arbeitet in jeder der Ab- 
15 teilungen A bis H wie folgt, um fur jeden Trelliszustand A 
bis H aus den vier m-Bit-W6rtern der Eingangs-Pf admetriken 
ZM1:4 und aus der Information der bis dahin akkumulierten 
alten Pfadmetrik PPM die Entscheidung uber die neue maximale 
Pfadmetrik abzuleiten: 

20 

Vor dem Beginn des Betriebs erfolgt eine Initialisierung, 
indem alle Entscheidungsbits EBPi und EBFi und alle Bits fur 
die maximalen Pf admetriken PMMia:b in alien Prozessorelemen- 
ten auf 0 gesetzt werden. Dann werden die aufeinander folgen- 
|^2 5 den m-Bit-W6rter der von der BMU gelieferten Zweigmetriken ZM 
in Zeitabstanden T angelegt, und zwar jedes Wort ZMi in einem 
" zeitgestaf f elten Parallelf ormat " , wobei die Bits innerhalb 
des selben Wortes um einen Halbtakt-Abstand T/2 zueinander 
versetzt sind, gemafi dem nachstehend tabellierten Schema: 

30 
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Tabelle 3 



OA 


4>B 


<DA 




OA 




ZMi (m-1) 




vVUl u ^ 

ZMi (m-1) 




wor u o 
ZMi (m-1) 






Wort" 1 

ZMi (m-2) 




VVvJX. u z 

ZMi (m-2) 










Wort 1 
ZMi (m-3) 




Wort 9 
ZMi (m-3) 










Wort 1 
ZMi (m-4) 














Wort 1 
ZMi (m-5) 

















ft Somit werden die m Bits 2 m ~ 1 , 2 m ' 2 , 2 m " 3 , . 2° eines jeden 
Zweigmetrik-Wortes nacheinander im Halbtakt-Abstand T/2 in 
5 die Kaskade getaktet, beginnend mit dem MSB, und durchlaufen 
die so gebildete Pipeline mit der Taktfrequenz 2/T. Mit dem 
Erscheinen des Bits 2 m ~ 1 (also des MSB) des ersten Zweigme- 
trik-Wortes, werden alle Entscheidungsbits der ersten Kaska- 
denstufe, also die Bits EBPi(m-l) und EBPi(m-l), auf den 

10 Binarwert 1 gestellt und wahrend der gesamten Folgezeit auf 
diesem Wert gehalten. 

In jedem Prozessorelemente PEi(n) wird im ADD-Block das 
Zweigmetrik-Bit ZMi (n) zu der 2-Bit-Zahl PMMa(n), PMMb(n) der 

^15 maximalen Pfadmetrik PMM(n) aus der jeweils zustandigen ACSU- 
Abteilung addiert, das Maximum aus den vier neuen Pfadmetri- 
ken wird ausgewahlt, und fur jeden der vier Zweige werden die 
beiden Entscheidungsbits EBPi (q) und EBFi(q) gebildet. Das 
Zweigmetrik-Bit ZMi (n) deckt dabei den Wertebereich (0:1) *2 n 

20 ab (das Symbol * ist das Multiplikationszeichen) , und die 2- 
Bit-Zahl PMMa:b(n) ist eine modifizierte Darstellung des 
zugeordneten Bits der neuen maximalen Pfadmetrik; diese Zahl 
deckt den Wertebereich (0:2) *2 n ab. Der Ausgang des ADD- 
Bloc??kes deckt den Wertebereich (0:3) *2 n ab, wobei das 

25 Carry-Bit CAi (n) mit dem Wert 2*2 n zum vorangehenden 

Prozessorelement PE(n+l) weitergereicht wird. Am Eingang des 
MOD-Blockes liegt somit wieder eine Pf admetrikbit-Darstellung 
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mit dem Wertebereich (0:2) *2 n an, gebildet durch das 
Summenbit SU(n) und das Carry-Bit CA(n-l) des nachf olgenden 
Prozessorelementes PE(n-l) . 

Der MOD-Block modifiziert diese Zahlendarstellung wie folgt: 



Tabelle 4 



Eingangsinf ormation von MOD 


Modif izierte 
Darstellung 


Zahlenwert 


Eingangsbits 


dezimal 


dual 


SU 


CA 


a 


b 


0 


00 


0 


0 


0 


0 


1 


01 


0 


1 


1 


0 


1 


0 


2 


10 


1 


1 


1 


1 



Mit der so modif izierten Darstellung ist es moglich, durch 
die beschriebenen zwei 4-ODER-Verkniipf ungen im MAX-Block die 
redundante 2-Bit-Darstellung PMMa:b(n) des Maximums der ins- 
gesamt vier praliminaren 2-Bit-Pf admetrikdarstellungen 
PMPla:b(n), PMP2a:b(n), PMP3a:b(n) und PMP4a:b(n) zu gewin- 
nen . 

Die Entscheidungsbits EBPi(n) und EBFi(n) werden in den 
Bloc??ken MOD und VGL gemaS folgender Logikvorschrif t 
gebildet : 



Tabelle 5 



EBFi (n+1) 


EBPi (n+1) 


DIFFi (n) 


EBFi (n) 


EBPi (n) 






-2 


0 


0 


1 


1 


-1 


1 


0 






£0 


1 


1 






<^0 


0 


0 


1 


0 


+1 


1 


0 






+2 


1 


1 


0 


0 


X 


0 


0 



Hierin bedeutet DIFFi (n) die maximale Differenz zwischen der 
finalen Pfadmetrik PMFi (n) , die durch die 2 Bits PMFia:b(n) 
dargestellt wird, und den 3 praliminaren Pfadmetriken PMj (n) , 
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die aus den drei anderen Prozessorelementen PEj (n) kommen und 
deren jede dargestellt werden durch die 2 Bits PMPja:b(n), 
wobei j = 1, 2, 3, 4 auSer i ist. X bedeutet "beliebiger 
Wert" . 

5 

Hat EBFi(n) den Wert 0, dann wird dies gewertet als Informa- 
tion zum definitiven Ausschluss des betreffenden Zweiges i. 
Die Kombination EBFi (n) =1 und EBPi(n)=0 wird gewertet als 
Information zu einem voraussichtlichen Ausschluss. Die Kombi- 
10 nation EBFi (n) =1 und EBPi(n)=l besagt, dass der betreffende 

Zweig vermutlich der Survivor sein wird. Die praliminaren Und 
^ f inalen Entscheidungsbits werden beim MSB der Zeigmetrik 
m (also beim (m-l)-ten Bit) beginnend berechnet und weiterge- 

reicht, bis schlie&lich am LSB (also beim 0-ten Bit) die ein- 
15 deutige Entscheidung bereitsteht. 

Wie den Figuren 8 und 9 zu entnehmen ist, liegen zwischen den 
Gattern relativ lange Leitungen fur die Verteilung der Si- 
gnale, so dass entsprechende Leitungstreiber benotigt werden. 
20 Diese Treiber sind in den Figuren 8 und 9 aus Grunden der 
Ubersichtlichkeit nicht dargestellt, wohl aber in der Fig. 
10, die den "kritischen Pfad" zeigt, das heiSt, den zeitlich 
langsten Signalweg von einem Register (bzw. Latch) ins nach- 
ste. Dieser Signalweg ist es somit, der die hochstmogliche 
|^2 5 Geschwindigkeit des Gesamtsystems begrenzt. Geschwindigkeits- 
steigerungen (Taktf requenzerhohungen) konnen nur durch Be- 
schleunigung dieses kritischen Pfades erzielt werden, bis 
schliefelich ein anderer Pfad der kritischste ist. 



30 Obwohl die in den Figuren 8 und 9 gezeigte bekannte ACSU- 

Architektur beziiglich Durchsatz und Verlustleistung das der- 
zeitige Optimum darstellt, konnen damit die erhohten Anforde- 
rungen an f ortgeschrittene Dateniibertragungssysteme nicht 
befriedigend erfullt werden. Dies gilt insbesondere fur die 

35 in Entwicklung befindliche neue Generation von Festplatten- 
Controllern, die mit Datenraten von mehr als 2000 MBit/s ar- 
beiten sollen. 
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Bei der vorstehenden Beschreibung des Standes der Technik 
wurde als Beispiel davon ausgegangen, dass die Metriken auf 
einer Abstandsf unktion basieren, bei welcher die Decodierung 
5 durch Maximum-Auswahl erfolgen muS. Die angesprochenen Pro- 
bleme sind jedoch die gleichen, wenn man eine Abstandsf unk- 
tion benutzt, bei welcher statt der Maximum-Auswahl eine 
Minimum- Auswahl zu erfolgen hat. In jedem Fall gilt es, fur 
jeden Trelliszustand aus mehreren akkumulierten Metriken die 

10 in einem vorbestimmten Sinn "extreme" Metrik herauszuf inden, 
wobei dieser vorbestimmte Sinn, je nach Art der gewahlten 

^ Abstandsf unktion, entweder auf das Maximum oder das Minimum 
zielt. 

15 Die Aufgabe der Erfindung besteht darin, einen mit Bit-Pipe- 
lining arbeitenden Viterbi-Decoder so auszubilden, dass er zu 
hoheren Durchsatzen fahig ist, als sie der bisherige Stand 
der Technik erlaubt. Diese Aufgabe wird erf indungsgemafe durch 
die im Patentanspruch 1 angegebenen Merkmale gelost. 

20 

Demnach wird die Erfindung realisiert in einem Viterbi-De- 
coder, der ausgelegt ist zum Decodieren eines Faltungscodes 
auf der Basis eines Radix-2 X -Trellis mit 2 Z Zustanden, wobei 
x und z ganze Zahlen ^ 1 sind und wobei der Decoder im we- 
k 25 sentlichen drei Berechnungseinheiten enthalt. Die erste 
Berechnungseinheit , ermittelt aus periodisch aufeinander 
folgenden Mehrbit-Wortern einer Eingangssequenz fur jeden 
Trelliszustand die 2 X Zweigmetriken als Mehrbit-Worter . Die 
zweite Berechnungseinheit, die sogenannte ACSU, addiert fur 
30 jeden Trelliszustand in jeder Taktperiode die jeweils zuge- 
ordneten 2 X Zweigmetriken mit bisher akkumulierten 2 X Pfad- 
metriken aus 2 X Vorganger-Trelliszustanden und wahlt die in 
einem vorgewahlten Sinne extreme der so ermittelten 2 X Pfad- 
metriken als neue akkumulierte Pfadmetrik fur den Additions- 
35 vorgang der nachsten Periode aus. Die dritte Berechnungsein- 
heit ist ausgelegt zum Speichern der aus der zweiten Berech- 
nungseinheit gewonnenen Inf ormationen uber die Identitat der 
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Pf admetriken, die in den aufeinander folgenden Taktperioden 
in der zweiten Berechnungseinheit ausgewahlt werden . Die 
zweite Berechnungseinheit enthalt fur jeden Trelliszustand 2 X 
parallele Kaskaden von Prozessorelementen, welche hinterein- 
5 ander geschaltet sind fiir eine Pipeline-Verarbeitung der Bits 
der Zweigmetriken und der extremen Pf admetriken, fortschrei- 
tend mit abnehmendem Stellenwert der Bits. Ferner enthalt die 
zweite Berechnungseinheit fiir jeden Trelliszustand jeweils 
eine Extremwert-Auswahleinrichtung fiir alle Prozessorelemente 
10 gleicher Ordnungszahl innerhalb der Pipeline. Die Erfindung 
ist dadurch gekennzeichnet , dass die Anzahl der Prozessor- 
elemente in jeder der Kaskaden kleiner ist als die Anzahl m 
der Bits, die fiir die Dualzahldarstellung des Wertebereiches 
der Pf admetriken verwendet werden, indem jede der Kaskaden 
15 jeweils eine dem ganzzahligen Anteil von m/p entsprechende 

Anzahl INT (m/p) von Prozessorelementen enthalt, wobei p eine 
ganze Zahl mindestens gleich 2 und kleiner als m ist und 
wobei jedes dieser INT (m/p) Prozessorelemente innerhalb der 
Kaskade genau einem von INT (m/p) aufeinander folgenden 
20 disjunkten p-Bit-Gruppen der m Bits zugeordnet ist. 

Der Quotient m/p kann ganzzahlig oder nicht-ganzzahlig sein. 
Im ersteren Fall ist INT (m/p) gleich m/p, und jede Kaskade 
braucht nur aus insgesamt m/p Prozessorelementen zu bestehen, 
k 25 deren jedem eine p-Bit-Gruppe zugeordnet ist, also jeweils 

eines der m/p aufeinander folgenden disjunkten "p-Tupel" der 
m Bits. Eine Ganzzahligkeit von m/p kann man stets dadurch 
erreichen, dass man bei gegebener Zahl p die verwendete Bit- 
breite m fiir die Pfadmetriken im Bedarfsfall durch Voran- 
3 0 stellung von Nullbits auf ein ganzzahliges Vielf aches von p 
bringt . Man kann es aber auch bei einer eventuellen Nicht- 
Ganzzahligkeit des Quotienten m/p belassen. In diesem Fall 
ist in jeder Kaskade zusatzlich zu den INT (m/p) Prozessor- 
elementen, die jeweils einer p-Bit-Gruppe zugeordnet sind, 
35 ein weiteres Prozessorelement vorzusehen, das den restlichen 
Bits zugeordnet ist, deren Anzahl r kleiner ist als p. Dieses 
Prozessorelement wird vorzugsweise den r hochsten oder den r 
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niedrigsten Stellenwerten in der m-Bit-Folge zugeordnet . 

Die " im vorgewahlten Sinne extremen" Metriken konnen entweder 
die jeweils maximalen oder die jeweils minimalen Metriken 
5 sein, je nachdem, welche Art von Abstandsfuntion ftir die Er- 
mittlung der Zweigmetriken verwendet wird. 

Mit der Erfindung wird also eine gegenuber dem Stand der 
Technik modifizierte Architektur der ACSU angegeben. Statt 

10 der bekannten 1-Bit-Prozessorelemente werden Mehrbit-Bit- 

Prozessorelemente verwendet, also p-Bit-Prozessorelemente mit 
_ 2 < p < m, vorzugsweise mit p=2 . Dies scheint zunachst dem 

Erfolg zu widersprechen, den man sich allgemein von dem Prin- 
zip des Bit-Pipelining verspricht. Es zeigt sich jedoch, dass 

15 man mit der erf indungsgemaSen Mehrbit-Architektur tatsachlich 
eine Durchsatzsteigerung und zusatzlich noch weitere Vorteile 
erzielen kann. Bei einer erf indungsgemaEen Mehrbit-Architek- 
tur sind fur eine gegebene Bitbreite m nur 1/p so viele Pro- 
zessorelemente erforderlich wie bei der bekannten 1-Bit- 

20 Architektur. Hierdurch vermindert sich die Latenzzeit der 

Pipeline auf 1 p-tel im Vergleich zur bekannten 1-Bit-L6sung . 
Ferner ist das zur Verfugung stehende Energiebudget pro Pro- 
zessorelement p-mal so hoch. 

^^5 Allerdings wird durch die ^2-Bit-Architektur die Komplexitat 
der Berechnungen erheblich gesteigert, was sich normalerweise 
negativ auf die Geschwindigkeit und den maximalen Durchsatz 
auswirken konnte. In besonderer Ausfuhrungsf orm der Erfindung 
wird diesem eventuellen Nachteil jedoch entgegengewirkt durch 

30 Einfiihrung einer neuen, redundanten Zahlendarstellung, womit 
es gelingt, den kritischen Pfad ahnlich kurz wie bei der be- 
kannten Architektur zu halten, insbesondere wenn die Extrem- 
wert-Auswahl die Auswahl des Maximums ist. Hierbei ist aller- 
dings wiederum die Komplexitat der einzelnen Gatterstufen 

35 hoher. GemaS einer vorteilhaf ten Ausgestaltung der Erfindung 
kann jedoch eine signifikante Beschleunigung erzielt werden 
durch den Einsatz von dynamischen Schaltungstechniken wie der 
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aus der Literatur [6] bekannten DOMINO-Logik, ohne dass ins- 
gesamt ein Mehraufwand an Flache und Energie erforderlich 
ist . 

5 Die Erfindung wird nachstehend an einem Ausfuhrungsbeispiel 
anhand der Figuren 11 bis 14 naher erlautert. 

Fig. 11 zeigt in einer groben Blockdarstellung den Aufbau 

zweier aufeinander folgender Prozessorelemente einer 
10 erf indungsgemaS ausgebildeten ACSU mit p = 2, also 

mit einer 2-Bit-Architektur ; 
Fig. 12 zeigt eines der Prozessorelemente nach Fig. 11 in 
p detaillierter Darstellung; 

Fig. 13 zeigt isoliert die Bestandteile des kritischen Pfa- 
15 des in der erf indungsgemaS ausgebildeten ACSU; 

Fig. 14 zeigt ein Beispiel fur dynamische Schaltungstechnik . 

Das im folgenden beschriebene Ausfuhrungsbeispiel der Erfin- 
dung betrifft ebenso wie das oben beschriebene Beispiel des 
20 Standes der Technik den Aufbau einer ACSU- Abtei lung fur einen 
Radix-4-Trellis mit 8 Zustanden, um fur einen Trelliszustand 
die neue maximale Pfadmetrik PMM ( t+T) zu ermitteln aus den 
Zweigmetriken ZM1:4 der vier Eingangszweige und den alten raa- 
ximalen Pfadmetriken PMM(t) der den Eingangszweigen zugeord- 
^25 neten Vorganger-Trelliszustande . Die in den Figuren 11 und 12 
gezeigten Schaltungsblocke ahneln in gewissen Aspekten den 
Blocken des Standes der Technik nach den Figuren 8 und 9 und 
sind deswegen mit den gleichen Abkiirzungen bezeichnet wie 
dort; gleiches gilt fur die Signalbits und deren verwendete 
3 0 Kurzbezeichnungen . 

Ein wesentlicher Unterschied gegenuber dem Stand der Technik 
besteht darin, dass bei dem beschriebenen Ausfuhrungsbeispiel 
jedes Prozessorelement jeweils zwei Bits eines m-stelligen 
35 Pf admetrik-Wortes verarbeitet; es ist also p = 2. Ferner wird 
davon ausgegangen, dass m/p ganzzahlig ist, d.h. m ist gerad- 
zahlig. Fur jede der Pfadmetriken PMl : 4 sind demnach m/2 Pro- 
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zessorelemente vorgesehen. 1 <> n < m sei die Ordnungszahl der 
aufeinander folgenden Bits, gezahlt ab dem niedrigstwertigen 
Bit LSB, und 1 < q < m/2 sei die Ordnungszahl der direkt 
aufeinander folgenden disjunkten Bitpaare, gezahlt ab dem 
niedrigstwertigen Bitpaar. Ein beliebiges Prozessorelement 
PE(q) verarbeitet das q-te Bitpaar, also das 2n-te und das 
(2n+l)-te Bit. Das vorangehende Prozessorelement PE(q+l), 
sofern vorhanden, verarbeitet das (q+l)-te Bitpaar, also das 
(2n+2)-te und das (2n+3)-te Bit. Das nachfolgende Prozessor- 
element PE(q-l), sofern vorhanden, verarbeitet das (q-l)-te 
Bitpaar, also das (2n-2)-te und das (2n-l)-te Bit. In der 
nachstehenden Beschreibung und auch in den Figuren 11 und 12 
ist das niedrigerwertige Bit jedes Bitpaars durch das Symbol 
"-0" und das hoherwertige Bit durch das Symbol "-1" innerhalb 
des Suffix des Bitnamens gekennzeichnet . 

Die insgesamt m/2 mal 4 Prozessorelemente fur die vier Zweig- 
metriken ZM1:4 haben alle den gleichen Aufbau und bilden eine 
Anordnung aus 4 Reihen. Die Fig. 11 zeigt, als stellvertre- 
tendes Beispiel fur alle Prozessorelemente, zwei benachbarte 
Prozessorelemente PE4 (q) und PE4(q+l) fur das q-te und das 
(q+l)-te Bitpaar der Zweigmetrik ZM4 , und zwar speziell fur 
die ACSU-Abteilung A, die dem Trelliszustand A zugeordnet 
1st. Ferner gezeigt sind die Blocke MAX fur die Erzeugung der 
Br£V, welche das Maximum PMM(q) bzw. PMM(q+l) der Pfadmetrik- 
Bits aus alien Prozessorelementen PEl:4(q) bzw. PEl:4(q+l) 
der ACSU-Abteilung A signalisieren . Die Fig. 12 zeigt detail- 
liert den Aufbau der Prozessorelemente am Beispiel des Pro- 
zessorelementes PE4(q) . 

Im Betrieb arbeitet jede Reihe von m/2 hintereinander ge- 
schalteten Prozessorelementen zeitgestaf f elt urn jeweils einen 
Halbtakt T/2 versetzt von links nach rechts, also beginnend 
mit dem hochstwertigen Bitpaar und f ortschreitend bis zum 
niedrigstwertigen Bitpaar. 

In jedem Prozessorelement PEi(q) empfangt der Block ADD das 
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q-te Bitpaar ZMi-O(q), ZMi-l(q) der Zweigmetrik ZMi und eine 
redundance 4-Bit-Darstellung PMMia:d(q) des q-ten Bitpaars 
der maximalen Pfadmetrik. Der Block ADD liefert zwei Summen- 
bits SUi-0 und SUi-1, die im Halbtakt <I>A weitergegeben wer- 
5 den, und ein Carry-Bit CAi, das zum vorangehenden Prozessor- 
element PE(q+l) der selben Reihe riickgekoppelt wird. Der 
Blocks ADD enthalt das in Fig. 12 gezeigte System von Gattern 
mit logischen Funktionen UND, NAND, ODER, Exklusiv-ODER (XOR) 
und Exklusiv-NOR (XNOR) , urn die Summe aus den Pf admetriken 

10 PMMia:d(q) , die in 4-Bit-Thermometerdarstellung vorliegen, 

und den Zweigmetriken ZMi-0:l(q), die als 2-Bit-Dualzahldar- 
stellung vorliegen, zu bilden. Die Ausgange SUi-0, SUi-1 und 
^k; CAi reprasentieren diese Summe in Dual zahldarst el lung, wobei 
SUi-0 die Wertigkeit 2 2n , SUi-1 die Wertigkeit 2 (2n+1) und CAi 

15 die Wertigkeit 2 (2n+2) besitzen. 

Der Block MOD hat zwei Summenbit-Eingange zum Empfang der im 
Halbtakt $A weitergegebenen Summenbits SU-0 und SU-1, einen 
Carry- Eingang, auf den das Carry-Bit vom Block ADD des nach- 
20 folgenden Prozessorelementes PEi(q-l) riickgekoppelt wird, und 
auSerdem zwei Entscheidungsbit-Eingange zum Empfang eines 
praliminaren Entscheidungsbits EBP(q+l) und eines finalen 
Entscheidungsbits EBF(q-fl), die vom Block VGL des vorangehen- 
den Prozessorelementes PE(q+l) erzeugt werden. Der Block MOD, 
|L^25 der aus einem System von UND-Gattern und ODER-Gattern be- 
% steht/ verknupft diese vier empfangenen Bits, um acht Aus- 

gangsbits zu erzeugen: eine redundante praliminare 4-Bit- 
Darstellung PMPa:d flir das q-te Bitpaar der Pfadmetrik und 
eine redundante finale 4-Bit-Darstellung PMFa:d fur das q-te 
30 Bitpaar der Pfadmetrik. 

Die Logikf unktion des MOD-Blockes ist so, dass der Binarwert 
0 eines Entscheidungsbits aus dem vorangehenden Prozessor- 
element PEi(q+l) die jeweils zugeordnete Vierergruppe der 
35 MOD-Ausgangsbits des Prozessorelementes PEi(q) "maskiert", 
also ebenfalls auf 0 setzt. Das heifit, wenn das praliminare 
Entscheidungsbit EBPi(q+l) den Binarwert 0 hat, dann gehen 
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alle vier Ausgangsbits PMPia:d(q) auf 0, und wenn das finale 
Entscheidungsbit EBFi (q+1 ) den Binarwert 0 hat, dann gehen 
alle vier Ausgangsbits PMFia:d(q) auf 0. 

Die acht MOD-Ausgangsbits PMPiard und PMFia:d werden uber die 
dargestellten Latch-Schaltungen LOB im Halbtakt OB weiterge- 
geben. Im einzelnen werden die vier praliminaren Pfadmetrik- 
Bits PMPia:d vom Block MOD im Halbtakt OB auf ein zugeord- 
netes Adernquartett eines 16-adrigen Vertei lungs -Lei tungsbiin- 
dels gegeben. Dieses Vertei lungsbundel enthalt insgesamt vier 
verschiedene Adernquartette, deren jedes genau einem der vier 
Prozessorelemente PEl:4(q) zugeordnet ist. 

Die vier finalen Pf admetrik-Bits PMFia:b(q) werden im 
Halbtakt OB dem Vergleicherblock VGL angelegt. Im selben 
Halbtakt empfangt der VGL-Block das Ergebnis einer ODER- 
Verknupfung der praliminaren Pf admetrik-Bits PMPja der drei 
anderen Prozessorelemente PEj (q) , das Ergebnis einer ODER- 
Verknupfung der praliminaren Pf admetrik-Bits PMPjb der drei 
anderen Prozessorelemente PEj (q) , das Ergebnis einer ODER- 
Verkniipfung der praliminaren Pf admetrik-Bits PMPjc der drei 
anderen Prozessorelemente PEj (q) und das Ergebnis einer ODER- 
Verkniipfung der praliminaren Pf admetrik-Bits PMPjd der drei 
anderen Prozessorelemente PEj (q) . Der Block VGL empfangt im 
Halbtakt OB ferner das praliminare Entscheidungsbit EBPj (q+1) 
des vorangehenden Prozessorelementes PEj (q+1). Der VGL-Block 
enthalt ein System von Multiplexern, urn das praliminare 
Entscheidungsbit EBPj (q) und das finale Entscheidungsbit 
EBFj (q) zu erzeugen. 

Der Block MAX enthalt vier ODER-Gatter, urn die vier Bits 
PMMia:d(q) fur die redundante 4-Bit-Darstellung des q-ten 
Bitpaares der maximalen Pfadmetrik zu erzeugen. Das erste 
ODER-Gatter empfangt alle vier praliminaren Pf admetrik-Bits 
PMPl:4a(q) aus den vier Prozessorelementen PEl:4(q) und 
stellt das Bit PMMa(q) genau dann auf den Wert Binarwert 1, 
wenn mindestens eines dieser vier empfangenen Bits gleich 1 
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ist. Das zweite, dritte und vierte ODER-Gatter verknupfen 
nach der gleichen Regel die praliminaren Pf admetrik-Bits 
PMPl:4b(q) bzw. PMPl:4c(q) bzw. PMPl:4d(q) aus den vier Pro- 
zessorelementen PEl:4(n) . 

5 

Das vorstehend anhand der Figuren 11 und 12 beschriebene neue 
ACSU-System arbeitet wie folgt, urn fur jeden Trelliszustand A 
bis H aus den vier m-Bit-W6rtern der Eingangs-Pf admetriken 
ZM1:4 und aus der Information der bis dahin akkumulierten al- 
io ten Pfadmetrik PMM die Entscheidung tiber die neue maximale 
Pfadmetrik abzuleiten: 

^ Vor dem Begmn des Betriebs erfolgt eine Initialisierung, in- 
dent alle Entscheidungsbits EBPi und EBFi und alle Bits fur 

15 die maximalen Pf admetriken PMMiazd in alien Prozessorelemen- 
ten auf 0 gesetzt werden. Dann werden aufeinander folgende m- 
Bit-W6rter der von der BMU gelieferten Zweigmetriken ZM in 
Zeitabstanden T angelegt, und zwar derart, dass aufeinander- 
folgende disjunkte Bitpaare innerhalb des selben Wortes um 

20 einen Halbtakt-Abstand T/2 zueinander versetzt sind, gemaS 
dem nachstehend tabellierten Schema: 
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Tabelle 6 



OA 


OB 




<DB 


$A 




Wort 1 
ZMi (m~l ) 
(m-2) 




Wort 2 

t-Jl 1_L \ ill X J 

(m-2) 




Wort 3 

^jlYll \ m— ± ) 

(m-2) 


• • • 




Wort 1 
ZMi (m- 1 
(m-4) 




Wort 2 

7Mi f m ^ 

(m-4) 




... 






Wort 1 

ZjIu j_ v III 3 ; 

(m-6) 




Wort 2 

Z.JX11 I IQ— O ; 

(m-6) 


• • • 








Wort 1 
ZMi (m-7) 
(m-8) 














Wort 1 
ZMi (m-9) 
(m-10) 

















Somit werden die m/2 Bitpaare (2 m_1 , 2 m " 2 ) ; ( 2 m " 3 , 2 m ~ 4 ) ; (2 m_5 ,2 m ~ 6 ) 
... (2 1 ,2°) eines jeden Zweigmetrik-Wortes nacheinander im 
5 Halbtakt-Abstand T/2 in die Kaskade getaktet, beginnend mit 
dem hochstwertigen Bitpaar (2 m ~ 1 , 2 m ~ 2 ) . Dieses hochstwertige 
Zweigmetrik-Bitpaar wird aus Nullen bestehen, ebenso auch 
eines oder mehrere direkt folgende Bitpaare, da der Wert der 
Zweigmetriken ZMi kleiner ist als der akkumulierte Wert, den 
10 die Pf admetriken PMi erreichen konnen und auf den die Bit- 
- breite m der Verarbeitung zugeschnitten sein muS. Die Zweig- 
d metrik-Bitpaare durchlaufen die durch die Kaskade gebildete 
Pipeline mit der Taktfrequenz 2/T. Mit dem Erscheinen des 
Bits 2 m_1 (also des MSB) des ersten Zweigmetrik-Wortes werden 
15 alle Entscheidungsbits der ersten Kaskadenstuf e, also die 
Bits EBPi ( (m/2) -1) und EBFi ( (m/2 ) -1) , auf den Binarwert 1 
gestellt und in der Folgezeit auf diesem Wert gehalten. In 
der Notation der Bitpaare, wie sie in der vorstehenden 
Beschreibung anhand der Figuren 11 und 12 benutzt wird, 
20 lautet die Eingabef olge : (m/2)-tes Bitpaar; ( (m/2 ) -1 ) ) -tes 
Bitpaar; ( (m/2 ) -2 ) ) -tes Bitpaar; ...; erstes Bitpaar. Das 
heiSt, ein "q-tes" Bitpaar enthalt die Bits 2 2n und 2 2n+1 , und 
ein "(q+D"-tes Bitpaar enthalt die Bits 2 2n+2 und 2 2n+3 , wobei 
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n von 0 bis m-1 reicht und q von 0 bis (m/2)-l reicht. 

In jedem q-ten Prozessorelemente PEi(q) wird im ADD-Block das 
Bitpaar 2 2n und 2 2n+1 (q-tes Bitpaar) der Zweigmetrik ZMi zu 
der Zahl addiert, die durch die 4 Bits PMMa:d(q) dargestellt 
wird. Hierbei handelt es sich urn eine redundante Darstellung 
des q-ten Bitpaares der maximalen Pfadmetrik aus der jeweils 
zustandigen ACSU-Abteilung . Das Maximum aus den vier neuen 
Pfadmetriken wird ausgewahlt, und fur jeden der vier Zweige 
werden die beiden Entscheidungsbits EBPi(q) und EBFi(q) ge- 
bildet (Fig. 11) . Das Zweigmetrik-Bitpaar deckt dabei den 
Wertebereich (0:3) *2 n ab (das Symbol * ist das Multiplikati- 
onszeichen) . Die redundante 4-Bit-Darstellung PMMa:d(q) deckt 
den Wertebereich (0:4) *2 n ab. Der Ausgang des ADD-Blockes 
deckt den Wertebereich (0:7) *2 n ab, wobei das Carry-Bit 
CAi(q) mit dem Wert 4*2 n zum vorangehenden Prozessorelement 
PE(q+l) weitergereicht wird. Am Eingang des MOD-Blockes liegt 
somit wieder eine Pf admetrik-Darstellung fur einen Werte- 
bereich (0:4) *2 n an, gebildet durch die beiden Summenbits SU- 
0i(q) und SU-li(q) und das Carry-Bit CAi(q-l) aus dem nach- 
folgenden Prozessorelement PE(q-l) . 

Der MOD-Block modifiziert diese Zahlendarstellung wie folgt: 



Tabelle 7 



Eingangs information 
von MOD 


Modif izierte Darstellung 
( Thermometerdars tel lung ) 


Zahlenwert 


Eingangs - 
bits 










dezim. 


dual 


SUO 


SU1 


CA 


a 


b 


c 


d 


0 


000 


0 


0 


0 


0 


0 


0 


0 


1 


001 


0 


0 


1 


1 


0 


0 


0 






1 


0 


0 










2 


010 


0 


1 


0 


1 


1 


0 


0 






1 


0 


1 










3 


011 


1 


1 


0 


1 


1 


1 


0 






0 


1 


1 










4 


100 


1 


1 


1 


1 


1 


1 


1 
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Mit der so modif izierten Darstellung ist es moglich, durch 
die beschriebenen vier 4-ODER-Verknupfungen im MAX-Block die 
redundante 4-Bit-Darstellung PMMa:d(q) des Maximums der ins- 
5 gesamt vier praliminaren 4-Bit-Darstellungen PMPla:d(q) , 
PMP2a:d(q), PMP3a:d(q) und PMP4a:d(q) zu gewinnen. 

Die modifizierte Darstellung ist eine sogenannte "Thermome- 
ter " -Darstellung, die mehr Bits benotigt als die Dualzahl- 

10 darstellung. Allgemein besteht eine Thermometerdarstellung 

einer beliebigen naturlichen Zahl "v" des Zahlenbereiches 0:u 
aus einem u-Bit-Wort, wobei die Zahl "v" dargestellt wird 

^ durch den Binarwert 1 aller v ersten Bits, gezahlt ab einem 
verabredeten Ende (also ab der vorderen oder der hinteren 

15 Grenze) des Wortes . Eine Dualzahldarstellung benotigt be- 

kanntlich INT [Id (u+1) ] Bits (also den ganzzahligen Anteil des 
Basis-2-Logarithmus von u+1) . Die groSere Bitbreite der Dual- 
zahldarstellung und der damit verbundene Mehraufwand, insbe- 
sondere auch bei der Verteilung der Pf admetriken, ist jedoch 

20 gerechtf ertigt wegen der nunmehr einfachen Maximum-Bildung 
und der einfachen Ent schei dungs f indung . Die Maximum-Bildung 
erfolgt wie bei der bekannten 1-Bit-Archi tektur mittels ODER- 
Verknupfung (Fig. 12) . 

&5 Die Entscheidungsbits EBPi und EBFi werden in den Blocken MOD 
und VGL gemaS folgender Vorschrift gebildet: 



Tabelle 8 



EBFi (q+1) 


EBPi (q+1) 


DIFFi (q) 


EBFi (q) 


EBPi (q) 






<; -2 


0 


0 


1 


1 


-l 


1 


0 






^ 0 


1 


1 






< 2 


0 


0 


1 


0 


3 


1 


0 






4 


1 


1 


0 


0 


X 


0 


0 



30 Hierin bedeutet DIFFi (q) die maximale Differenz zwischen der 
finalen Pfadmetrik PMFi(q), die durch die 4 Bits PMFia:d(q) 
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dargestellt wird, und den 3 praliminaren Pf admetriken PMj (q) , 
die aus den drei anderen Prozessorelementen PEj (q) kommen und 
jeweils dargestellt >rerden durch die 4 Bits PMPja:d(q), wobei 
j = 1, 2, 3, 4 auSer i ist. Das Symbol "X" bedeutet wiederum 
"beliebiger Wert" . 

Hat das finale Entscheidungsbit EBFi(q) den Wert 0, dann wird 
dies gewertet als Information zum definitiven Ausschluss des 
betref fenden ^Zweiges i. Die Kombination EBFi (q) =1 und 
EBPi(q)=0 wird gewertet als Information zu einem voraussicht- 
lichen Ausschluss. Die Kombination EBFi (q) =1 und EBPi(q)=l 
besagt, dass der betref fende Zweig vermutlich der Survivor 
sein wird. Die praliminaren und finalen Entscheidungsbits 
wer|feri beim hochstwertigen Bitpaar (also beim (m/2-l)-ten 
Bitpaar) beginnend berechnet und weitergereicht , bis schlieS- 
lich am niedrigstwertigen Bitpaar (also beim 0-ten Bitpaar) 
die eindeutige Entscheidung bereitsteht. 

Die Fig. 13 zeigt den kritischen Pfad der neuen 2-Bit-Archi- 
tektur. Die Zahl der Gatter ist hier genau so groS wie beim 
^r^tischen Pfad (Fig. 10) der bekannten l-Bit-Architeiktur . In 
der 2-Bit-Architektur sind die Gatter jedoch komplexer, was 
sich ungiinstig auf die Laufzeit auswirken konnte . Urn dies zu 
verhindern, ist eine Realisierung der Gatter mittels dynami- 
scher Schaltungstechniken, vorzugsweise mittels der aus [6] 
an sich bekannten DOMINO -Logik, besonders vorteilhaft. Bei 
Implementierung dieser Technik kann die Funktion der Latch- 
Schaltungen LOA bzw. LOB f die in den Figuren 11 und 12 als 
gesonderte Elemente dargestellt sind, gut in die ADD- und 
MOD-B16cke integriert werden. Eine solche Integrierung spart 
zusatzlich Laufzeit. 

Bei den " statischen" Logik-Gattern, wie sie insbesondere in 
integrierten Schaltungen bisher bevorzugt werden, wird die 
voll-komplementare CMOS-Technik angewandt. Hierbei ist das 
Netzwerk gesteuerter Schaltelemente , welche durch die Ein- 
gangsvariablen je nach deren Binarwert durchgeschaltet oder 
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gesperrt werden, doppelt realisiert, einmal durch MOS-Feldef- 
f ekttransistoren mit n-leitendem Kanal (N-FETs) und einmal in 
komplementarer Weise durch MOS-Feldeff ekttransistoren mit p- 
leitendem Kanal (P-FETs) . Die beiden Netzwerke sind hinter- 
einander zwischen die Versorgungspotentiale geschaltet, und 
die AusgangsgroSe wird am Verbindungspunkt abgegriffen. Der 
Vorteil dieser Anordnung ist, dass Strom nur wahrend der kur- 
zen Zeitspanne fliefet, in welcher ein Zustandswechsel an den 
Eingangen oder am Ausgang stattfindet. Wegen der grolSen An- 
zahl der Transistoren, insbesondere bei komplexen Logikfunk- 
tionen, ist aber der Platzbedarf solcher Gatter ziemlich 
groS. Wenn man statt des komplementaren P-FET-Schaltnetzes 
nur einen einzigen P-FET als Pull-Up-Transistor einsetzt, ist 
der Platzbedarf zwar kleiner, jedoch erfordert der statische 
Pull-Up-Strom dann viel Leistung und verlangsamt das Pull- 
Down. Bei dynamischen Logik-Gattern ist das besagte Schalt- 
netzwerk nur einmal vorgesehen, und zwar unter Verwendung von 
N-FETs, die weniger Platz beanspruchen als P-FETs. Statt des 
zweiten Schaltnetzwerkes oder eines Pull-Up-Transistors ist 
eine Vorlade-, Auswerte- und Halteschaltung vorgesehen, die 
mit wenigen Transistoren auskommt. 

Die Fig. 14 zeigt ein Beispiel dynamischer Schaltungstechnik, 
speziell fur ein Gatter mit einer Logikf unktion gemaS der 
Booleschen Gleichung: 

y = [ (xl • x2) + x3] • x4 , 
wie es mehrfach in der MOD-Schaltung nach Fig. 12 enthalten 
ist. Das Symbol • ist der Operator fur UND-Verknupf ung, und 
das Symbol + bezeichnet die ODER-Verknupf ung . 

Im oberen Teil der Fig. 14 ist dieses M UND-ODER-UND" -Gatter 
in der ublichen Symboldarstellung gezeichnet, wie sie in Fig. 
12 benutzt wird, zusammen mit der nachgeschalteten Latch, bei 
der es sich z.B. urn eine der Latch-Schaltungen LOB in Fig. 12 
handeln kann. Der mittlere Teil der Figur zeigt den Aufbau 
des Gatters in dynamischer Schaltungstechnik. Innerhalb der 
gestrichelten Umrahmung ist das aus N-FETs Nl , N2 , N3 und N4 
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gebildete Schaltnetzwerk fur die Logikfunktion gezeichnet. 
Die Gates dieser N-FETs sind zum Empfang der Eingangsvaria- 
blen xl, x2, x3 und x4 angeschlossen . Das eine Ende dieses 
Schaltnetzwerkes liegt am negativeren der beiden Versorgungs- 
5 potentiale (z.B. Masse), welches das "niedrige" Logikpoten- 
tial fur den Binarwert "0" sei . Das andere Ende ist iiber die 
Reihenschaltung eines als N-FET gebildeten Auswertetransis- 
tors N5, der durch ein Auswertesignal EVL (evaluate) steuer- 
bar ist, und eines als P-FET gebildeten Vorladetransistors 

10 PI, der durch ein Vorladesignal PRC (precharge) steuerbar 
ist, mit dem positiveren Versorgungspotential verbunden, 
welches das "hohe" Logikpotential fur den Binarwert "1" sei. 

I* Des weiteren ist eine Halteschaltung vorgesehen, bestehend 

aus einem dem Vorladetransistor Pi parallelgeschalteten P-FET 

15 P2 und einem Inverter INV, uber den der Drain des P-FET P2 
auf das Gate ruckgekoppelt ist. Die AusgangsgroEe y wird am 
Ausgang des Inverters INV abgegriffen. 

Im unteren Teil der Fig. 14 ist ein Zeitdiagramm der Signale 

20 EVL und PRC und des Ausgangssignals y dargestellt. Das dyna- 
mische Gatter nach Fig. 14 wird wie folgt betrieben: Zum Aus- 
werten der Eingangsbedingung wird zunachst ein Vorladebetrieb 
realisiert, indem zuerst EVL und kurz danach PRC von hohem 
auf niedrigen Pegel gebracht werden, so dass PI leitet und 

^25 der Knoten K2 zwischen Pi und N5 auf hohen Pegel geht. Hier- 
durch geht der Ausgang des Inverters INV auf "0" Kurz danach 
wird PRC wieder auf hohen Pegel gebracht; der Inverter INV 
behalt jedoch seinen Zustand und K2 bleibt hoch, infolge der 
Ruckkopplung tiber P2 . Nach diesem Vorladebetrieb erf olgt die 

3 0 eigentliche Auswertung, indem EVL wieder auf hohen Pegel ge- 
bracht wird und N5 somit leitend wird. Erfullen die Eingangs- 
variablen die Bedingung 

[ (xl • x2) + x3] • x4 = 1, 
dann ist das Schaltnetzwerk (innerhalb des gestrichelten Rah- 

3 5 mens) niederohmig, so dass der Knoten K auf niedrigen Pegel 
geht und der Inverter eine "1" liefert. Sollte die obige Be- 
dingung nicht erfullt sein, ist das Schaltnetzwerk hochohmig, 
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und der Inverterausgang bleibt auf "0". 

In der beschriebenen Weise kann jedes beliebige Logik-Gatter 
als "dynamisches " Gatter unter Verwendung relativ weniger 
5 Transistoren konstruiert werden, indem man das Schaltnetzwerk 
innerhalb des gestrichelten Rahmens gemaS der jeweils ge- 
wunschten Logikf unktion ausbildet. Somit lasst sich der Auf- 
wand fur die komplexen Gatterschaltungen in den Blocken MOD 
und ADD einer erf indungsgemaSen ACSU in vertretbaren Grenzen 

10 halten. Ein weiterer Vorteil ist, dass fur die Latch-Schal- 
tungen an den Ausgangen der M0D-B16cke (Figuren 11 und 12) 
keine eigenen Schaltungen erforderlich sind, denn die Latch- 
Funktion kann von der ohnehin vorhanden Halteschaltung (In- 
verter INV und Transistor P2 ) am Ausgang jedes dynamischen 

15 Gatters ubernommen werden. Hierzu konnen die Taktsignale fur 
die Halbtakte OA und <£B so geformt werden, dass sie die Rolle 
der Auswertesignale EVL an den dynamischen Gattern uberneh- 
men. 

20 Die dynamischen Gatter konnen in vorteilhaf ter Ausgestaltung 
der Erfindung speziell gemaS der sogenannten DOMINO-Technik 
ausgebildet sein, wie sie detailliert in [6] beschrieben ist. 
Hierbei erfolgt das Vorladen des Ausgangs auf hohen Pegel, 
wahrend der zum niedrigen Potential fuhrende Weg geof fnet 
^2 5 wird, und das Vorladen wird gestoppt, wahrend der Weg zum 
niedrigen Potential aktiviert wird. 

Die vorstehende Beschreibung anhand der Figuren 11 bis 14 
betrifft nur ein Ausf iihrungsbeispiel der Erfindung, betref- 

30 fend einen Radix-4-Trellis . Das Prinzip der Erfindung ist je- 
doch nicht beschrankt auf einen solchen Trellis, sondern kann 
allgemein auf alle denkbaren Radix-2 X -Trellisse mit x ^ 1 
angewendet werden. Hierbei ist die Anzahl der Zweigmetriken, 
die fur jeden Trelliszustand verarbeitet werden mussen, und 

35 die Anzahl der zu vergleichenden akkumulierten Pfadmetriken 
naturlich entsprechend niedriger oder hoher. Auch kann die 
Anzahl der Trelliszustande groSer oder kleiner als 8 sein; 
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derzeit wird in Praxis mit 16 oder 32 (oder sogar noch mehr) 
Trelliszustanden gearbeitet. 

Auch ist die Erfindung nicht beschrankt auf die Einrichtung 
einer 2-Bit-Architektur , wie sie vorstehend detailliert als 
Beispiel beschrieben wurde. Die Prozessorelemente der Kaskade 
konnen auch so ausgestaltet werden, dass sie p > 2 Zweigme- 
trik-Bits simultan verarbeiten. Eine solche Ausgestaltung 
liegt naturlich ebenfalls im Bereich der Erfindung. 

Ferner sei erwahnt, dass die in der Fig. 12 dargestellten 
speziellen Ausbildungen der Blocke ADD, MOD, VGL und MAX nur 
Beispiele bzw. bevorzugte Ausfiihrungsf ormen sind. Ausschlag- 
gebend sind die von diesen Blocken zu realisierenden Logik- 
funktionen, die auch durch andere als die gezeigten Beispiel- 
schaltungen verwirklicht werden konnen. 

Die vorangehend als Beispiel beschriebene ACSU arbeitet mit 
Maximum- Auswahl . Wird zur Ermittlung der Zweigmetriken in der 
BMU eine Abstandsf unktion verwendet, die eine Minimum- Auswahl 
fur die Survivoren erfordert, mussen manche Logikf unktionen 
in der ACSU invertiert werden. Ein Fachmann wird ohne wei- 
teres in der Lage sein, die hierzu notwendigen Modif ikationen 
vorzunehmen . 
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Patentanspruche 

1. Viterbi-Decoder zum Decodieren eines Faltungscodes auf 
der Basis eines Radix-2 X -Trellis mit 2 2 Zustanden, wobei x 
5 und z ganze Zahlen ^ 1 sind, enthaltend: 

eine erste Berechnungseinheit (BMU) , die aus periodisch 
aufeinander folgenden Mehrbit-Wortern einer Eingangssequenz 
fur jeden Trelliszustand die 2 X Zweigmetriken (ZMi) als 
Mehrbit-Worter berechnet; 

10 eine zweite Berechnungseinheit (ACSU) , die fur jeden 

Trelliszustand in jeder Taktperiode die jeweils zugeordneten 
2 X Zweigmetriken (ZMi) mit bisher akkumulierten 2 X Pfadme- 
triken (PMM) aus 2 X Vorganger-Trelliszustanden addiert und 
die in einem vorgewahlten Sinne extreme der so ermittelten 2 X 

15 Pfadmetriken (PMi) als neue akkumulierte Pfadmetrik (PPM) fur 
den Additionsvorgang der nachsten Periode auswahlt; 

eine dritte Berechnungseinheit (SMU) zum Speichern der 
aus der zweiten Berechnungseinheit (ACSU) gewonnenen Informa- 
tionen iiber die Identitat (i) der Pfadmetriken (PMi), die in 

2 0 den aufeinander folgenden Taktperioden in der zweiten Berech- 
nungseinheit ausgewahlt werden, 

wobei die zweite Berechnungseinheit (ACSU) fur jeden 
Trelliszustand enthalt: eine Anzahl 2 X paralleler Kaskaden 
von Prozessoreiementen (PE) , die hintereinander geschaltet 
gjfc2 5 sind fur eine Pipeline-Verarbeitung der Bits der Zweigmetri- 
ken und der extremen Pfadmetriken (PPM) , f ortschreitend mit 
abnehmendem Stellenwert der Bits, und jeweils eine Extrem- 
wert-Auswahleinrichtung (MAX) fur alle Prozessorelemente 
gleicher Ordnungszahl (q) innerhalb der Pipeline; 

30 dadurch gekennzeichnet, 

dass die Anzahl der Prozessorelemente (PE) in jeder der 
Kaskaden kleiner ist als die Anzahl m der Bits, die fur die 
Dualzahldarstellung des Wertebereiches der Pfadmetriken (PM) 
verwendet werden, indem jede der Kaskaden jeweils eine dem 

35 ganzzahligen Anteil von m/p entsprechende Anzahl INT(m/p) von 
Prozessoreiementen (PEl:m/p) enthalt, wobei p eine ganze Zahl 
mindestens gleich 2 und kleiner als m ist und wobei jedes 
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dieser INT(m/p) Prozessorelemente innerhalb der Kaskade genau 
einem von INT(m/p) aufeinander folgenden disjunkten p-Bit- 
Gruppen der m Bits zugeordnet ist. 

5 2. Viterbi-Decoder nach Anspruch 1, gekennzeichnet durch 
derartige Bemessung der Zahlen m und p, dass m/p ganzzahlig 
ist, so dass jede Kaskade aus insgesamt m/p Prozessorelemen- 
ten besteht, deren jedem eine p-Bit-Gruppe zugeordnet ist. 

10 3. Viterbi-Decoder nach Anspruch 1, dadurch gekennzeichnet, 
dass m/p nicht-ganzzahlig ist und dass jede Kaskade zusatz- 
lich zu den INT (m/p) Prozessorelementen ein weiteres Prozes- 
sorelement enthalt, das der r-Bit-Gruppe zugeordnet ist, die 
als Rest nach Abzug der INT (m/p) p-Bit'-Gruppen bleibt. 

15 

4. Viterbi-Decoder nach Anspruch 3, dadurch gekennzeichnet, 
dass das weitere Prozessorelement den r hochstwertigen Bits 
Oder den r niedrigstwertigen Bits der m Bits zugeordnet ist. 

20 5. Viterbi-Decoder nach einem der Anspruche 1 bis 4, 

dadurch gekennzeichnet dass jedes Prozessorelement (PEi) 
f olgendes enthalt : 

eine Addiereinrichtung (ADD) zum Bilden der als Dualzahl 
dargestellten Summe zweier Zahlen, deren eine dargestellt ist 
,^25 als Dualzahl durch die zugeordnete Gruppe der Zweigmetrik- 
Bits und deren andere eine redundante Darstellung (PMMa:d) 
der zugeordneten Gruppe der Bits der bisher akkumulierten 
extremen Pfadmetrik ist; 

eine Modif iziereinrichtung (MOD) , die als EingangsgroSen 

30 die p niedrigstwertigen Bits (SUi-0, SUi-1) der besagten 

Summe und das Carry-Bit (CAi) aus der Addiereinrichtung des 
in der Kaskade nachf olgenden Prozessorelementes (Ordnungszahl 
q-1) und ein praliminares und ein finales Entscheidungsbit 
(EBP, EBF) von dem in der Kaskade vorhergehenden Prozessor- 

35 element (Ordnungszahl q+1) empfangt, urn eine redundante Dar- 
stellung (PMPiard) der zugeordneten Gruppe der Bits einer 
praliminaren Pfadmetrik (PMP) und eine redundante Darstellung 
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(PMFiard) der zugeordneten Gruppe der Bits einer finalen 
Pfadmetrik (PMF) zu liefern; 

eine Vergleicheinrichtung (VGL) , die durch Verkntipfung 
der finalen Pf adinetrik-Darstellung (PMFiard) aus dem betref- 
5 fenden Prozessorelement (PEi) mit den 2 X -1 praliminaren Pfad- 
metrik-Darstellungen (PMFjard) aus den anderen Prozessorele- 
menten (PEj) gleicher Ordnungszahl (q) das praliminare Ent- 
scheidungsbit (EBPi) und das finale Entscheidungsbit (EBFi) 
fur das nachfolgende Prozessorelement (Ordnungszahl q-1) 
10 bildet. 

6. Viterbi -Decoder nach Anspruch 5, dadurch gekennzeichnet 
dass zwischen den Ausgangen der Addiereinrichtung (ADD) 

und den Eingangen der Modif iziereinrichtung (MOD) ein erstes 
15 Latchregister (LOA oder L<£B) vorgesehen ist 

und dass an den Ausgangen der Modif iziereinrichtung 

(MOD) ein zweites Latchregister (L$B oder LOA) vorgesehen ist 
und dass die beiden Latchregister urn eine halbe Periode 

der Taktrate versetzt getaktet sind. 



20 



7. Viterbi-Decoder nach einem der Anspruche 1 bis 6, 
dadurch gekennzeichnet, 

dass die extremen Pf admetriken (PMM) die jeweils maxima- 
len Pf admetriken sind. 



8. Viterbi-Decoder nach einem der Anspruche 5 bis 7, 

dadurch gekennzeichnet, 

dass die redundanten Darstellungen Thermometerdarstel- 

lungen sind, jeweils bestehend aus einem u-Bit-Wort, wobei u 
3 0 der hochste Wert der darzustellenden naturlichen Zahl ist und 

der tatsachliche Wert v dargestellt ist durch einen selben 

vorgewahlten Binarwert genau aller v ersten Bits, gezahlt ab 

einem vorgewahlten Ende des Wortes, 

und dass jede Extremwert-Auswahleinrichtung (MAX) eine 
35 Anzahl u logischer ODER-Gatter enthalt, deren jedes die 2 X 

Bits gleicher Ordnungszahl aus den Thermometerdarstellungen 

derjenigen praliminaren Pf admetrikbits (PMPi) empfangt, die 
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der betreffenden Gruppe der Zweigmetrik-Bits zugeordnet sind, 
so dass jedes der besagten ODER-Gatter an seinem Ausgang 
eines der u Bits der Thermometerdarstellung (PPMa:d) der 
zugeordneten Bit-Gruppe der bisher akkumulierten extremen 
Pf admetrik lief ert . 

9. Viterbi-Decoder nach Anspruch 8, dadurch gekennzeichnet , 
dass p = 2 ist und dass u = 4 ist. 

10. Viterbi-Decoder nach einem der Anspruche 1 bis 7, 
dadurch gekennzeichnet, dass p = 2 ist. 

11. Viterbi-Decoder nach einem der Anspruche 1 bis 10, 
dadurch gekennzeichnet, dass x = 2 ist. 

12. Viterbi-Decoder nach einem der Anspruche 5 bis 11, 
dadurch gekennzeichnet, 

dass die Addiereinrichtung (ADD) , die Modif iziereinrich- 
tung (MOD) und die Vergleicheinrichtung (VGL) jedes Prozes- 
sorelementes logische Gatter enthalten, 

und dass alle logischen Gatter in der zweiten Berech- 
nungseinheit (ACSU) dynamische Schaltungen sind, vorzugsweise 
in DOMINO-Technologie. 

13. Viterbi-Decoder nach den Anspruchen 6 und 12, dadurch 
gekennzeichnet, dass die Funktionen der Latchregister (L$A, 
LOB) in den dynamischen Gattern der Addiereinrichtung (ADD) 
und der Modif iziereinrichtung (MOD) implementiert sind. 
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Zusammenf assung 



Viterbi -Decoder 



Beschrieben wird ein Viterbi-Decoder mit einer Berechnungs- 
einheit (ACSU) fur einen Radix-2 X -Trellis , die fur jeden 
Trelliszustand die jeweils zugeordneten 2 X Zweigmetriken 
(ZMi) mit bisher akkumulierten 2 X Pf admetriken (PMM) aus 2 X 
Vorganger-Trelliszustanden addiert und die extreme der so 
ermittelten 2 X Pf admetriken (PMi) als neue akkumulierte 
Pfadmetrik (PMM) fur den Additionsvorgang der nachsten 
Periode auswahlt, wobei besagte Berechnungseinheit enthalt: 
fur jeden Trelliszustand 2 X parallele Kaskaden von Prozes- 
sorelementen (PE) zur Pipeline-Verarbeitung der Bits der 
Zweigmetriken und der Pf admetriken (PMM) , und fiir jeden 
Trelliszustand jeweils eine Extremwert-Auswahleinrichtung 
(MAX) fur alle Prozessorelemente gleicher Ordnungszahl (q) 
innerhalb der Pipeline. Erf indungsgemaS ist die Anzahl der 
Prozessorelemente (PE) in jeder der Kaskaden kleiner als die 
Anzahl m der Bits, die fiir die Dualzahldarstellung des Werte- 
bereiches der Pf admetriken (PM) verwendet werden. Hierzu sind 
Prozessorelemente in jeder Kaskade so ausgebildet, dass sie 
jeweils disjunkte Gruppen von p^2 Bits zusammenhangend verar- 
beiten. 
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Radix-2-Trellis mit vier Zustanden , digitale Obertragung 

Beispiel: Zweigmetrik ZM = [ 2 - Hammingdistanz (s. e)] 
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FIG. 1 



Radix-2-Trellis mit vier Zustanden , analogs Ubertragung 

Beispiel: Zweigmetrik ZM = 3 - Is - el 
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FIG. 3 



Radix-4- Trellis m'rt vier Zustanden , digitale Ubertragung 

Beispiel: Zweigmetrik ZM = [4 - Hammingdistanz (s, e)] 
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FIG. 4 



Radix-4- Trellis mit vier Zustanden, analoge Ubertragung 

Beispiel: ZweigmetrikZM = 6 - QeO - s0| + |e1 - slQ 
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Radix-4- Trellis mit acht Zustanden 
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ACSU-Abteilung A aus Fig. 7 



|< — 1-Bit-Prozessorel©mente PE1:4— >k- 1-Bit-Prozessorelemente PE1:4 — 1\ 
farBit(n+1) 1 far Bit (n) 




Stand der Technik 



3(AH 




AO I JH 



Jl CO 



Q_ > 




T 



- c o c 

<D to 
CO _J 



o 



.S 

_Q 
CO 



0) 
T3 



CO 



O) E 

CD 

<^ 

<P 
|| 

<* o 
r cn 
-A oi 

CO N 

o e 

15 

"a 

CL 



c £ 
E -o 

O c 

e m 

CL l_ 
CD 




+ 

CL cn 

1 5 

£ ? 

O C 

§ £ 

£ CD 

± a 

£D 

CN 



S3 




MO D £ 



3 + ^ +_ 



ADD 

6k tttt 



SUP 




< 



421 A<j 




.{ 





1 

CD 

X 



CO 

o 

LL 



IP 

<tt D _ 



y = [ (x1 • x2) + x3] • x4 




Fig. 14 



